pandas中使用excel的模糊匹配通配符，真香

前言

在 pandas 中，实现如下的模糊匹配统计，要怎么做？

简单：

因为在 pandas 中可以把筛选和统计两种逻辑分开编写，所以代码清晰好用。 问题在于pandas 中要实现模糊匹配，只能使用正则表达式或某种具体的函数。

在 excel 中有一类可以模糊匹配的统计函数，比如 sumifs 、 countifs 等，它们可以使用通配符实现模糊匹配统计。之前的 excel 公式：

问号 ? 表示1个任意的字符，星号 * 表示任意个数(0、1、或n)的字符
对比来看，这可以直接在字符串中表达出 pandas 中的 startswith , endswith , contains

这种直接在字符串中表达模糊匹配规则，真香！难道在 pandas 中无法做到？

正则表达式的特殊字符

要在字符串中表达匹配规则，用正则表达式是最好的选择。其实思路挺简单，不就是直接把表达字符串中的符合替换成正则表达式相对于的符号吗？如下：

行3：正则表达式中的点 . ，表示任意一个字符
行4：在表达式前后添加开始 ^ 和结束 $ 标志

问题在于，用户输入的表达字符串里面可能包含了正则表达式的其他符号：

这里我希望表达的是，搜索内容中有加号 + ，但因为 加号在正则表达式中有1或多个字符的意思 ，导致结果仍然匹配成功(内容中根本没有加号)

在 python 的正则表达式库中，为此有专门的函数，可以把所有在正则表达式中有特殊意义的符号，转义成匹配内容：

处理后的结果中，加号 + 前面添加了反斜杠，正则表达式中反斜杠可以把特殊含义符号转义成普通内容

正确步骤

现在我们已经把整个问题拆分成2个小问题(并有解决方法)：

excel 的通配符在正则表达式中的对应表达
排除正常正则表达式中的特殊符号

只要设计好这两个步骤的执行顺序，应该就可以顺利解决问题。

定义函数：

函数只做一件事情，把匹配字符串转成符合要求的表达式字符串
行4： 首先用 re.escape 转成普通内容，然后针对星号和问号做替换

定义一个测试函数：

行3： re.match 返回有结果，就是匹配到

写一些简单的测试：

没有报错，证明没问题。

应用到 pandas 的 series.str.match 函数即可：

不过，每次都这样子调用很啰嗦。可以封装到一个函数里面：

现在可以使用：

不要忘记一键三连。你的点赞、收藏、关注，是我创作的动力。

展开阅读全文

页面更新：2024-05-04

标签：通配符模糊斜杠加号星号字符串函数符号字符内容

1 2 3 4 5

报告称Pixel 7 Pro物料成本约413美元，其中超过一半组件来自三星

去年谷歌正式发布了新一代Pixel 7系列智能手机，搭载了第二代Tensor芯片，即Tensor G2。Tensor G2是谷歌第二款半定制SoC，是与三星合作开发的。三星在旗舰级手机的组件供应上有着巨大的影响力，近期市场机构的调查报告再次从

达叔写指标（2月10日）：在“后浪推前浪”指标中找寻上升趋势！

今天是2月10日周五，我是达叔，今天我为大家来带了 “后浪推前浪”指标。【指标图示】【指标源码】{行业}Z1:=STRCAT(HYBLOCK,' ');Z2:=STRCAT(Z1,FGBLOCK);Z3:=STRCAT(Z2,DYBLOCK);Z4:=STRCAT(Z3,' ');DRAWTEXT_FIX(ISLA

撑不住了？美芯片界开始“硬刚”，倪光南院士说的很对

美国作为目前市场的尖端科技第一强国，针对于半导体领域有着不小的话语权，但老美有一个很恶劣的行为，那就是打压其他国家和企业的尖端科技发展。目前就是“捍卫”自身国际市场主导地位，可由于不顾及美企巨头们损失的行为

突然大降价！网友懵了：刚买就亏这么多

近日，有消息称，iPhone 14 Pro系列全部版本近日迎来700元优惠，范围几乎覆盖所有授权门店。这事，还一度冲上了热搜当前，苹果官网和天猫官方旗舰店的iPhone 14 Pro系列价格尚未下降，iPhone 14 Pro起售价仍为7999元；iPhone 14 Pr

张红超_2023年新社交时代崛起地背后逻辑与思路

在经济，政治和疫情的共同作用下，美国科技公司的业绩不佳，特别是在Meta、以Twitter为代表的社交媒体巨头。这些工具将允许开发者使用用户上传的照片来生成自己的面部表情包。一方面，像苹果这样的平台公司紧缩隐私政策，致使

用 20 行代码制作 ChatGPT 机器人

ChatGPT 已迅速成为全球最受欢迎的人工智能应用程序之一。让我们制作我们自己的 ChatGPT 机器人！创建机器人创建我们自己版本的 ChatGPT 机器人的第一步是从 OpenAI API 获取 API 密钥。OpenAI API 为开发者提供了三

iOS 17重点改进爆料曝光！所支持机型再次减少，iPhone8用户无缘

没有意外！2023年苹果WWDC的全球开发者大会将在6月举行，届时将公布新一代iOS 17、iPadOS 17、watchOS 10、macOS 14与tvOS 17系统。此次发布会的重头戏，自然是iOS 17系统的发布。随着发布会的时间越来越近，iOS 17的各种重

红网数说丨长沙第6个制造业千亿级产业如何养成？有何过人之处

新春伊始湖南制造业传来好消息长沙先进储能材料产业产值首次突破1000亿元成为长沙第6个制造业千亿级产业为湖南省打造国家重要先进制造业高地注入强劲动能至此长沙六大千亿级产业格局形成都有谁？一起来看看先进储能材

走进企业看信心｜“干”出“新机遇”

天津港，通达世界180多个国家和地区的500多个港口，是“一带一路”的海陆交汇点和服务全面对外开放的国际枢纽港。港口，是经济运行的重要“晴雨表”。开年以来，天津港码头机器轰鸣、货运吞吐创下新高、国际班列接踵而至，折射

泰安：服务企业发展，夯实产业链高质量发展根基

去年以来，泰安市新型建材产业链专班紧紧围绕新型工业化强市建设战略部署，紧盯企业急难愁盼，主动作为靠前服务，春风化雨增动力，助解难题促发展，做到有需必应、无事不扰，全市新型建材产业链发展保持稳中向好、进中提质的良好态

蓝特光学：国内光学元件领军者，车载+消费领域布局蓄力长期成长

（报告出品方/作者：东吴证券，马天翼、唐权喜、王润芝）1. 国内光学元件领军者，多领域布局构筑长期增长力1.1. 国内光学元件领先供应商，业务布局持续完善深耕光学元件二十余载，产品品类、下游应用及客户持续拓展蓄力长期成长。

1月份工业品价格整体继续下降 PPI同比下降0.8%

来源：人民网原创稿人民网北京2月10日电 (记者杨曦)国家统计局今日公布数据显示，2023年1月份，全国工业生产者出厂价格同比下降0.8%，环比下降0.4%；工业生产者购进价格同比上涨0.1%，环比下降0.7%。国家统计局城市司首席统计师

河北银保监局发布风险提示：警惕汽车消费贷款陷阱

2月2日，河北银保监局发布2023年第1期消费者风险提示。风险提示指出，近期，一些不法分子冒充银行工作人员诱导消费者签订车贷陷阱合同，在签订合同过程中存在故意隐瞒、虚高贷款金额、签订空白合同等情况。针对消费者反映集

这一巨头宣布：裁员超6000人！这里“现象级”裁员潮蔓延

周四，美国两年期国债收益率盘中一度上探4.446%，超出十年期国债收益率85.7个基点，使得两者的倒挂程度达到1980年代初以来最深，释放了未来一年美国经济可能陷入衰退的信号。9日美股三大股指全线下跌纳指跌超1%另外，继美国纽

重磅！MSCI旗舰指数调整，这些股票被纳入

北京时间2月10日早间，全球知名指数公司MSCI宣布了季度审核变更结果。在本次调整中，MSCI全球标准指数系列下的MSCI中国指数新纳入12只中国股票，剔除6只。由于MSCI中国指数被嵌套进MSCI新兴市场指数，因此股票进入MSCI中国指

上滑加载更多 ↓

pandas中使用excel的模糊匹配通配符，真香

前言

正则表达式的特殊字符

正确步骤

报告称Pixel 7 Pro物料成本约413美元，其中超过一半组件来自三星

达叔写指标（2月10日）：在“后浪推前浪”指标中找寻上升趋势！

撑不住了？美芯片界开始“硬刚”，倪光南院士说的很对

突然大降价！网友懵了：刚买就亏这么多

张红超_2023年新社交时代崛起地背后逻辑与思路

用 20 行代码制作 ChatGPT 机器人

iOS 17重点改进爆料曝光！所支持机型再次减少，iPhone8用户无缘

红网数说丨长沙第6个制造业千亿级产业如何养成？有何过人之处

走进企业看信心｜“干”出“新机遇”

泰安：服务企业发展，夯实产业链高质量发展根基

蓝特光学：国内光学元件领军者，车载+消费领域布局蓄力长期成长

1月份工业品价格整体继续下降 PPI同比下降0.8%

河北银保监局发布风险提示：警惕汽车消费贷款陷阱

这一巨头宣布：裁员超6000人！这里“现象级”裁员潮蔓延

重磅！MSCI旗舰指数调整，这些股票被纳入

黄景瑜前妻和前女友发类似内容，暗指迪丽热巴是小三，她们

mysql查询时字符串区分大小写问题

欢欣鼓舞，WhatsApp 更新终于为您提供表情符号反应

虹科干货 - 如何使用AR眼镜识别内容并展示3D模型？

儿童读物VS儿童毒物，又出现“不雅内容”，家长：简直是没完

jQuery - 自执行函数,jQuery包装集, Dom与jQuery对象

jQuery - 了解jQuery对象及$符号 272

字符界面安装Openeuler系统

风来之国全新DLC曝光！风来之国新内容复活吧海鸥镇DLC

造风口的VR，内容会是下一个赛点吗？