python数据处理

1.PyMySQL

一个纯 Python 实现的 MySQL 客户端库,它实现了 Python DB-API v2.0 规范,可以用于连接和操作 MySQL 数据库。

使用 PyMySQL 可以通过 Python 程序连接 MySQL 数据库服务器,并执行 SQL 语句进行数据的查询、插入、更新和删除等操作。PyMySQL 提供了一系列的 API 和方法,可以方便地进行数据库操作,例如连接数据库、查询数据、插入数据、更新数据、删除数据、提交事务、回滚事务等。

以下是使用 PyMySQL 连接 MySQL 数据库的基本步骤:

1
2
3
4
5
6
7
8
9
10
11
12
13
1. 安装 PyMySQL 库,可以使用 pip 命令进行安装:`pip install pymysql`

2. 导入 PyMySQL 模块:`import pymysql`

3. 建立数据库连接:`conn = pymysql.connect(host='localhost', port=3306, user='root', passwd='password', db='database_name')`

4. 创建游标对象:`cursor = conn.cursor()`

5. 执行 SQL 语句:`cursor.execute(sql)`

6. 获取查询结果或提交数据更改:`conn.commit()` 或 `result = cursor.fetchone()`

7. 关闭游标和数据库连接:`cursor.close()` 和 `conn.close()`

通过使用 PyMySQL,可以在 Python 程序中轻松地进行 MySQL 数据库操作,实现数据的存储、查询和处理等功能。

2.xlrd

xlrd是Python中的一个库,可以用于读取Excel文件。它可以读取Excel文件中的单元格数据,包括单元格中的文本、日期、数字等内容。使用xlrd库可以将Excel文件中的数据导入到Python程序中进行处理和分析。在使用xlrd库之前需要先安装,并通过import语句导入到Python程序中。

3.RE

Python中的re模块是用于处理正则表达式的模块。正则表达式是一种强大的文本匹配工具,可以用来实现字符串的搜索、替换、分割等操作。

以下是re模块中常用的函数:

1
2
3
4
- re.match(pattern, string, flags=0): 从字符串的开头开始匹配,如果匹配成功返回一个匹配对象,否则返回None。
- re.search(pattern, string, flags=0): 在字符串中搜索匹配,如果匹配成功返回一个匹配对象,否则返回None。
- re.findall(pattern, string, flags=0): 在字符串中搜索匹配,返回所有匹配的结果,以列表形式返回。
- re.sub(pattern, repl, string, count=0, flags=0): 在字符串中搜索匹配,将匹配到的部分替换为指定字符串,并返回替换后的字符串。

以上函数中的pattern参数就是正则表达式,可以使用一系列的元字符和特殊字符来表示不同的匹配规则,例如\d表示任意一个数字字符,\w表示任意一个字母数字字符等等

4.正则表达式

正则表达式是一种用于匹配文本的模式,它使用一些特殊字符和元字符来表示不同的匹配规则。正则表达式可以用于搜索、替换、分割、验证等操作。

以下是一些常用的正则表达式元字符:

  •  .:匹配任意一个字符,除了换行符。
     []:匹配方括号中任意一个字符,例如[A-Z]匹配任意一个大写字母。
     \d:匹配任意一个数字字符,等价于[0-9]。
     \D:匹配任意一个非数字字符,等价于[^0-9]。
     \w:匹配任意一个字母数字字符,等价于[A-Za-z0-9_]。
     \W:匹配任意一个非字母数字字符,等价于[^A-Za-z0-9_]。
     \s:匹配任意一个空白字符,包括空格、制表符、换行符等。
     \S:匹配任意一个非空白字符。
     ^:匹配字符串的开头。
     $:匹配字符串的结尾。
     *:匹配前面的字符0次或多次。
     +:匹配前面的字符1次或多次。
     ?:匹配前面的字符0次或1次。
     {m,n}:匹配前面的字符至少m次,至多n次。
    

除了以上元字符外,正则表达式还支持一些特殊字符,例如\转义字符、|或操作符、()分组等。

需要注意的是,不同编程语言中对正则表达式的支持可能有所不同,因此在使用时需要查看相应语言的文档或教程。

如果需要测试正则表达式的匹配效果,可以使用一些在线工具,例如Regex101、RegExr等。