有肌肉记忆了,但是还是很混乱我需要理清哪个是哪个
数据是Table,有column,有label和value
Table.column('label') == value
这时候会出现表合并,因为raw数据可能不够
- 自我合并 : group, select, drop, pivot
-- pivot categorical + categorical = 组合category, numerical col加上去,返回的是lst, 是numerical value的集合 t.pivot(cols, rows, vals = None , function_name = None)
-- group t.group([column, …], function_name = None) or just one col but not list
- 外部合并: join
-- join是一种补充信息,是数据库里面的主键和外键 链接,如果全是numerical,想添加categorical, 那就是用join来做外键对应,方便可视化
下位概念是 column
Table can
apply function to col, table.apply(func, col)
search where are suitable for some limit ,
and sort according numerical col.
column有什么能处理的呢?处理下位概念value?
用value的值构建新的column
数据出图,图是二维的,意思就是2个数构成一个点
意思就是永远关注 一个点 是由哪两个数构成的,涉及数和数之间的关系
所有的关系只有两种:绝对 和 相对
关系图有hist, plot, scatter , barh(目前)
- 绝对:plot,barh
- 相对:hist,scatter
思考问题,要看用什么关系,那就用什么图
数绝对,比例相对,hist就是面积是比例
图就是两个数列之间的对应关系