最近在做文本聚类时遇到,需要把某列的文本内容统一合并,其实很简单。
上代码
import pandas as pd
df = pd.DataFrame({'text':['今天天气不错,适合出去玩。',
'最近在上海举办了中国进口博览会,',
'各国大展拳脚,',
'希望国家越来越好,',
'人民越来越富。']})
print(df)
打印结果:
text
0 今天天气不错,适合出去玩。
1 最近在上海举办了中国进口博览会
2 各国大展拳脚,
3 希望国家越来越好
4 人民越来越富
content= ("".join(i for i in df['text']))
print(content)
打印结果:
'今天天气不错,适合出去玩。最近在上海举办了中国进口博览会,各国大展拳脚,希望国家越来越好,人民越来越富。'