看啥推荐读物
专栏名称: 进击的Coder
崔庆才的个人公众号,分享有关网络爬虫、Web开发、机器学习、技术心得、时事新闻、个人感悟等内容。
今天看啥  ›  专栏  ›  进击的Coder

比正则快 N 倍!这个库简直太香了!

进击的Coder  · 公众号  ·  · 2021-05-30 20:45
这是「进击的Coder」的第 429 篇技术分享作者:Ckend来源:Python实用宝典FlashText 算法是由 Vikash Singh 于2017年发表的大规模关键词替换算法,这个算法的时间复杂度仅由文本长度(N)决定,算法时间复杂度为O(N)。而对于正则表达式的替换,算法时间复杂度还需要考虑被替换的关键词数量(M),因此时间复杂度为 O(MxN)。简而言之,基于 FlashText 算法的字符串替换比正则表达式替换快 M 倍以上,这个 M 是需要替换的关键词数量,关键词越多,FlashText 算法的优势就越明显。下面就给大家介绍如何在 Python 中基于 flashtext 模块使用 FlashText 算法进行字符串查找和替换,如果觉得对你的项目团队很有帮助,请记得帮作者转发一下哦。1.准备开始之前,你要确保 Python 和 pip ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照