工作上常常要解决各种的数据信息,碰到新项目赶项目进度的过程中自身写涵数非常容易浪费时间。
Python中有很多内嵌涵数帮你提升工作效能。
一:依据标准在编码序列中选择数据信息
1.假定有一个数据目录 data, 过虑目录中的负值
应用列表推导式:
result = [i for i in data if i >= 0]
应用 fliter 过虑涵数:
result = fliter(lambda x: x>= 0, data)
2.学员的数学课成绩以词典方式储存,挑选在其中成绩超过 80 分的同学们
d = {x:randint(50, 100) for x in range(1, 21)} {k: v for k, v in d.items() if v > 80}
二:对词典的键值对开展旋转
应用 zip() 涵数
zip() 涵数用以将可迭代更新的目标做为主要参数,将目标中相对应的原素装包成一个个元组,随后回到由这种元组构成的目录。
>>> s1 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))} >>> s1{'b': 1, 'f': 4, 'g': 3, 'r': 1} >>> d = {k:v for k, v in zip(s1.values(), s1.keys())} >>> d{1: 'r', 4: 'f', 3: 'g'}
三. 统计分析编码序列中原素发生的频率
1.某任意编码序列中,寻找发生频次**的3个原素,他们产生的频次多少钱?
结构任意编码序列如下所示:
data = [randint(0,20) for _ in range(20)]
方式 1: 能够应用词典来统计分析,以目录中的数据信息为键,以发生的频率为值
from random import randint def demo(): data = [randint(0, 20) for _ in range(30)] # 目录中产生数据产生的频次 d = dict.fromkeys(data, 0) for v in li: d[v] = 1 return d
方式 2:立即应用 collections 控制模块下边的 Counter 目标
>>> data = [randint(0, 20) for _ in range(30)] >>> data[7, 8, 5, 16, 10, 16, 8, 17, 11, 18, 11, 17, 15, 7, 2, 19, 5, 16, 17, 17, 12, 19, 9, 10, 0, 20, 11, 2, 11, 10] >>> c2 = Counter(data) >>> c2Counter({17: 4, 11: 4, 16: 3, 10: 3, 7: 2, 8: 2, 5: 2, 2: 2, 19: 2, 18: 1, 15: 1, 12: 1, 9: 1, 0: 1, 20: 1}) >>> c2[14]4 >>> c2.most_common(3) # 统计分析频率发生**的3个数 [(17, 4), (11, 4), (16, 3)]
2. 对某英文文章英语单词开展统计分析,寻找发生频次*的单词及其发生的频次
根据之前的训练,我们知道可以用 Counter 来处理
import refrom collections import Counter # 统计分析某一文章内容中英语单词的高频词 with open('test.txt', 'r', encoding='utf-8')as f: d = f.read()total = re.split('W ', d) # 全部的词汇目录 result = Counter(total) print(result.most_common(10))
四.依据词典平均值的尺寸,对词典中的项开展排列
例如班集体中小学生的数学课考试成绩以词典的方式储存:
{"Lnad": 88, "Jim", 71...}
按照数学课分数从高到低开展排列
方式 1: 运用 zip 将词典转换为元组,再用 sorted 开展排列
>>> data = {x: randint(60, 100) for x in "xyzfafs"} >>> data{'x': 73, 'y': 69, 'z': 76, 'f': 61, 'a': 64, 's': 100} >>> sorted(data)['a', 'f', 's', 'x', 'y', 'z'] >>> data = sorted(zip(data.values(), data.keys())) >>> data[(61, 'f'), (64, 'a'), (69, 'y'), (73, 'x'), (76, 'z'), (100, 's')]
方式 2: 运用 sorted 涵数的 key 主要参数
>>> data.items() >>> dict_items([('x', 64), ('y', 74), ('z', 66), ('f', 62), ('a', 80), ('s', 72)]) >>> sorted(data.items(), key=lambda x: x[1]) [('f', 62), ('x', 64), ('z', 66), ('s', 72), ('y', 74), ('a', 80)]
五. 在好几个词典中寻找公共性键
具体情景:在足球比赛中,统计分析每场赛事均有入球的足球运动员
**轮: {"C罗": 1, "苏亚雷斯":2, "舍甫琴科": 1..}
第二轮: {"内马尔": 1, "梅西c罗":2, "格列兹曼": 3..}
第三轮: {"格列兹曼": 2, "C罗":2, "内马尔": 1..}
仿真模拟任意的入球足球运动员和入球数
>>> s1 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))} >>> s1{'d': 3, 'g': 2}>>> s2 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))} >>> s2{'b': 4, 'g': 1, 'f': 1, 'r': 4, 'd': 3} >>> s3 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))} >>> s3{'b': 4, 'r': 4, 'a': 2, 'g': 3, 'c': 4}
*获得词典的 keys,随后取每场赛事 key 的相交。因为赛事轮频次是无关的,因此应用 map 来批量操作
map(dict.keys, [s1, s2, s3])
随后一直积累取其相交,应用 reduce 涵数
reduce(lambda x,y: x & y, map(dict.keys, [s1, s2, s3]))
一行编码拿下!