数据处理入库实操
python数据处理
1.PyMySQL
一个纯 Python 实现的 MySQL 客户端库,它实现了 Python DB-API v2.0 规范,可以用于连接和操作 MySQL 数据库。
使用 PyMySQL 可以通过 Python 程序连接 MySQL 数据库服务器,并执行 SQL 语句进行数据的查询、插入、更新和删除等操作。PyMySQL 提供了一系列的 API 和方法,可以方便地进行数据库操作,例如连接数据库、查询数据、插入数据、更新数据、删除数据、提交事务、回滚事务等。
以下是使用 PyMySQL 连接 MySQL 数据库的基本步骤:
1 | 1. 安装 PyMySQL 库,可以使用 pip 命令进行安装:`pip install pymysql` |
通过使用 PyMySQL,可以在 Python 程序中轻松地进行 MySQL 数据库操作,实现数据的存储、查询和处理等功能。
2.xlrd
xlrd是Python中的一个库,可以用于读取Excel文件。它可以读取Excel文件中的单元格数据,包括单元格中的文本、日期、数字等内容。使用xlrd库可以将Excel文件中的数据导入到Python程序中进行处理和分析。在使用xlrd库之前需要先安装,并通过import语句导入到Python程序中。
3.RE
Python中的re模块是用于处理正则表达式的模块。正则表达式是一种强大的文本匹配工具,可以用来实现字符串的搜索、替换、分割等操作。
以下是re模块中常用的函数:
1 | - re.match(pattern, string, flags=0): 从字符串的开头开始匹配,如果匹配成功返回一个匹配对象,否则返回None。 |
以上函数中的pattern参数就是正则表达式,可以使用一系列的元字符和特殊字符来表示不同的匹配规则,例如\d表示任意一个数字字符,\w表示任意一个字母数字字符等等
4.正则表达式
正则表达式是一种用于匹配文本的模式,它使用一些特殊字符和元字符来表示不同的匹配规则。正则表达式可以用于搜索、替换、分割、验证等操作。
以下是一些常用的正则表达式元字符:
.:匹配任意一个字符,除了换行符。 []:匹配方括号中任意一个字符,例如[A-Z]匹配任意一个大写字母。 \d:匹配任意一个数字字符,等价于[0-9]。 \D:匹配任意一个非数字字符,等价于[^0-9]。 \w:匹配任意一个字母数字字符,等价于[A-Za-z0-9_]。 \W:匹配任意一个非字母数字字符,等价于[^A-Za-z0-9_]。 \s:匹配任意一个空白字符,包括空格、制表符、换行符等。 \S:匹配任意一个非空白字符。 ^:匹配字符串的开头。 $:匹配字符串的结尾。 *:匹配前面的字符0次或多次。 +:匹配前面的字符1次或多次。 ?:匹配前面的字符0次或1次。 {m,n}:匹配前面的字符至少m次,至多n次。
除了以上元字符外,正则表达式还支持一些特殊字符,例如\转义字符、|或操作符、()分组等。
需要注意的是,不同编程语言中对正则表达式的支持可能有所不同,因此在使用时需要查看相应语言的文档或教程。
如果需要测试正则表达式的匹配效果,可以使用一些在线工具,例如Regex101、RegExr等。