Python使用emoji库过滤掉文本表情符号
安装emoji包
pip3 install emoji
借用emoji过滤特殊表情
vi demoji.py
输入
import emoji import re text = emoji.demojize('?(珍品)小视频 https://www.aliyundrive.com/s/GouznGuYxvx') result = re.sub(':\S+?:', ' ', text) print(result)
输出:
(珍品)小视频 https://www.aliyundrive.com/s/GouznGuYxvx
这样就可以了
批量替换文件脚本
cat demoji.sh
#!/bin/bash #------------ Version Info ------------------- # Create Date: 2022-09-07 # Author: SDIX # Email: SDIX@QQ.COM # Version: NONE # Description: 批量替换文本 #--------------------------------------------- dir=$(cd `dirname $0`;pwd) demoji=$dir/demoji.py file=$dir/loli.txt result=$dir/data.txt [ ! -f $file ] && echo "$file not exist,please check the file." [ -f $result ] && rm -f $result while read line do /bin/sed -i "3c text = emoji.demojize('$line')" $demoji /usr/local/bin/python3 $demoji >> $result done < $file
<< 上一篇
下一篇 >>
网友留言(0 条)