个性化阅读
专注于IT技术分析

适用于初学者的Python数据科学备忘单

本文概述

最新O’Reilly数据科学薪酬调查的受访者中有54%表示他们将Python用作数据科学工具。与2015年的调查结果相比, 这是一个小幅增长, ​​在该调查中, 有51%的受访者表示使用Python。

没有人可以否认Python在数据科学行业中一直在兴起, 而且它似乎必将继续存在。

业界流行度的提高, Python数据分析软件包的悠久历史, 缓慢而渐进的学习曲线以及它是完全成熟的编程语言这一事实​​仅仅是使Python成为出色的数据工具的几个原因科学。

尽管Python是一种易读的语言, 但是你仍然可以使用一些帮助。

这就是srcmini为数据科学制作Python备忘单的充分理由, 特别是对于初学者。它可以为刚刚开始数据科学之旅的你提供快速参考, 也可以作为使学习和使用Python更容易的指南。

该备忘单是免费的其他材料, 是对srcmini的Python数据科学入门课程的补充, 你可以在中学到的东西来学习。

适用于初学者的Python数据科学备忘单

(以上是该备忘单的可打印版本)

该Python速查表将指导你完成变量和数据类型(字符串, 列表)的操作, 最终进入使用Python Numpy进行科学计算的基本程序包。

安装Python

下载Anaconda

图书馆

导入库

导入numpy
将numpy导入为np

选择性导入

从数学导入pi

寻求帮助

>>>帮助(STR)

变量和数据类型

变量分配

>>> x = 5
>>> x
5

变量计算

两个变量的总和
>>> x + 2
7
两个变量相减
>>> x-2
3
两个变量相乘
>>> x * 2
10
变量求幂
>>> x ** 2
25
余数
>>> x%2
1
变量的除法
>>> x / float(2)
2.5

类型和类型转换

字符串变量
str()
‘5’, ‘3.45’, ‘True’
变量到整数
int()
5, 3, 1
浮动变量
float()
5.0, 1.0
布尔变量
bool()
真实, 真实, 真实

弦乐

>>> my_string =’thisStringIsAwesome’
>>> my_string
‘thisStringIsAwesome’

字符串运算

>>> my_string * 2
‘thisStringIsAwesomethisStringIsAwesome’
>>> my_string +’Innit’
‘thisStringIsAwesomeInnit’
>>> my_string中的” m”
‘真正’

选择字符串字符

>>> my_string [3]
>>> my_string [4:9]

字符串方法

字符串大写
>>> my_string.upper()
字符串小写
>>> my_string.lower()
计数字符串元素
>>> my_string.count(‘w’)
替换字符串元素
>>> my_string.replace(‘e’, ‘i’)
从两端去除空格
>>> my_string.strip()

清单

>>> a =’是’
>>> b =’nice’
>>> my_list = [‘my’, ‘list’, a, b]
>>> my_list2 = [[4, 5, 6, 7], [3, 4, 5, 6]]

选择列表元素

子集

选择索引1处的项目
>>> my_list [1]
选择最后一项
>>> my_list [-3]

切片

选择索引1和2的项目
>>> my_list [1:3]
选择索引0之后的项目
>>> my_list [1:]
选择索引3之前的项目
>>> my_list [:3]
复制my_list
>>> my_list [:]

列表的子集列表

my_list [list] [itemOfList]
>>> my_list2 [1] [0]
>>> my_list2 [1] [:2]

列出操作

>>> my_list + my_list
[‘my’, ‘list’, ‘is’, ‘nice’, ‘my’, ‘list’, ‘is’, ‘nice’]
>>> my_list * 2
[‘my’, ‘list’, ‘is’, ‘nice’, ‘my’, ‘list’, ‘is’, ‘nice’]
>>> my_list2> 4
>>>正确

清单方法

获取项目的索引
>>> my_list.index(a)
盘点
>>> my_list.count(a)
一次追加一个项目
>>> my_list.append(‘!’)
删除项目
>>> my_list.remove(‘!’)
删除项目
>>> del(my_list [0:1])
反转清单
>>> my_list.reverse()
追加项目
>>> my_list.extend(‘!’)
删除项目
>>> my_list.pop(-1)
插入项目
>>> my_list.insert(0, ‘!’)
排序清单
>>> my_list.sort()

numpy数组

>>> my_list = [1、2、3、4]
>>> my_array = np.array(my_list)
>>> my_2darray = np.array([[1, 2, 3], [4, 5, 6]])

选择Numpy数组元素

子集

选择索引1处的项目
>>> my_array [1]
2

切片

选择索引0和1的项目
>>> my_array [0:2]
array([1, 2])

子集2D Numpy数组

my_2darray [行, 列]
>>> my_2darray [:, 0]
array([1, 4])

Numpy阵列运算

>>> my_array> 3
array([False, False, False, True], dtype=bool)
>>> my_array * 2
array([2, 4, 6, 8])
>>> my_array + np.array([5, 6, 7, 8])
array([6, 8, 10, 12])])

numpy数组函数

获取数组的尺寸
>>> my_array.shape
将项目追加到数组
>>> np.append(other_array)
将项目插入数组
>>> np.insert(my_array, 1, 5)
删除数组中的项目
>>> np.delete(my_array, [1])
数组的均值
>>> np.mean(my_array)
数组的中位数
>>> np.median(my_array)
相关系数
>>> my_array.corrcoef()
标准偏差
>>> np.std(my_array)

要下载此备忘单, 请单击下面的

适用于初学者的Python数据科学备忘单

如果你对更多备忘单感兴趣, 请查看我们的Bokeh备忘单, 以实现Python中的数据可视化;以及Pandas备忘单, 以实现Python中的数据操作。

你想要了解更多吗?立即完成数据科学Python入门课程!

赞(0)
未经允许不得转载:srcmini » 适用于初学者的Python数据科学备忘单

评论 抢沙发

评论前必须登录!