Python使用emoji库过滤掉文本表情符号
安装emoji包
pip3 install emoji
借用emoji过滤特殊表情
vi demoji.py
输入
import emoji
import re
text = emoji.demojize('?(珍品)小视频 https://www.aliyundrive.com/s/GouznGuYxvx')
result = re.sub(':\S+?:', ' ', text)
print(result)输出:
(珍品)小视频 https://www.aliyundrive.com/s/GouznGuYxvx
这样就可以了
批量替换文件脚本
cat demoji.sh
#!/bin/bash
#------------ Version Info -------------------
# Create Date: 2022-09-07
# Author: SDIX
# Email: SDIX@QQ.COM
# Version: NONE
# Description: 批量替换文本
#---------------------------------------------
dir=$(cd `dirname $0`;pwd)
demoji=$dir/demoji.py
file=$dir/loli.txt
result=$dir/data.txt
[ ! -f $file ] && echo "$file not exist,please check the file."
[ -f $result ] && rm -f $result
while read line
do
/bin/sed -i "3c text = emoji.demojize('$line')" $demoji
/usr/local/bin/python3 $demoji >> $result
done < $file<< 上一篇
下一篇 >>
网友留言(0 条)