drop_duplicate(subset,keep,inplace) #去重函数
subset:子列名
keep:保留第一列或最后一列,first/last
inplace:是否在本数据集修改
示例:
df.drop(subset=['item_id','buyer_admin_id'],keep='first')
#item_id和buyer_admin_id,单看这两列,如果两列元素一样的化就相当于重复(其他列不必看),重复了就要去掉
#keep参数保证保留的是第一次重复的列还是最后一次重复的列