python报错 1、AttributeError: 'float' object has no attribute 'split' https://blog.csdn.net/u012535605/article/details/81709834
pandas 1、pandas里的Series:线性数据结构,一维数组。 df.apply()所得的对象是Series类。 2、df.count():按列数数 df.groupby('属性'):所得为:属性,具体值 df.groupby('属性').count():所得对象是DataFrame类 accumulate(s):s序列里向前叠加的和的迭代器(itertools) e.g.s=[1,2,3]→for i in accumulate(s):print(i):[1,3,6]
3、zip():将可迭代对象对应元素打包成元组,得到由元组组成的列表。 注:若各迭代器的元素个数不一致→返回列表长度与最短的对象相同。 4、plt.hlines(y值,x始,x终) plt.text(x坐标,y坐标,字符串) 5、df.unique():数组形式,返回列的所有唯一值 df.nunique():唯一值个数
6、with open() as f:参考https://blog.csdn.net/msspark/article/details/86745391 7、np.concatenate((a,b,..),axis):默认axis=0,是对列加行;axis=1为对行加列。
jieba分词:精确模式、全模式和搜索引擎模式.
jieba.cut(sentence,cut_all=False,HMM=True) # 精确模式 jieba.cut(sentence,cut_all=True,HMM=True) # 全模式 jieba.cut_for_search(sentence, HMM=True) # 搜索引擎模式