Python使用emoji库过滤掉文本表情符号

安装emoji包

pip3 install  emoji

借用emoji过滤特殊表情
vi demoji.py
输入

  
import emoji
import re
text = emoji.demojize('?(珍品)小视频 https://www.aliyundrive.com/s/GouznGuYxvx')
result = re.sub(':\S+?:', ' ', text)
print(result)

输出:
(珍品)小视频 https://www.aliyundrive.com/s/GouznGuYxvx
这样就可以了
批量替换文件脚本
cat demoji.sh 

  
#!/bin/bash
#------------ Version Info -------------------
# Create Date:  2022-09-07
# Author:       SDIX
# Email:        SDIX@QQ.COM
# Version:      NONE
# Description:  批量替换文本
#---------------------------------------------
dir=$(cd `dirname $0`;pwd)
demoji=$dir/demoji.py
file=$dir/loli.txt
result=$dir/data.txt
[ ! -f $file ] && echo "$file not exist,please check the file."
[ -f $result ] && rm -f $result
while read line
do
        /bin/sed -i "3c text = emoji.demojize('$line')" $demoji
        /usr/local/bin/python3 $demoji >> $result
done < $file


分享到:
关键词:Linux运维

网友留言(0 条)

发表评论