全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworksBGVM服务器IP归属甄别会员请立即修改密码
查看: 440|回复: 11

[疑问] 正则大佬们,这玩意儿咋过滤

[复制链接]
发表于 前天 01:00 | 显示全部楼层 |阅读模式
本帖最后由 笑花落半世琉璃 于 2021-5-5 01:32 编辑

夜深了,大佬们还在嘛

整了一晚上,发现不会。。

啊没描述清楚,就是要去掉有Unicode编码的,这些显示出来全是空格的效果..想问下咋取出它们,这些显示出来全是空格的效果。



内容大概是这些:

<p>aaaaaaaaaaaaaaa</p>
<p>bbbbbbbbbbbb><ul><li></li<<a></a></p>
<p>cccccc</p>


      

在vs code里面是这样的,识别为未知字符。


然后现在在用这个https://regex101.com/去整正则,大佬们快救救我。
发表于 前天 01:02 | 显示全部楼层
所以你到底要取什么,给出原文和目标
发表于 前天 01:02 | 显示全部楼层
b qian pai bang ding
发表于 前天 01:04 | 显示全部楼层
楼主想取Unicode吧
 楼主| 发表于 前天 01:08 | 显示全部楼层
nnt 发表于 2021-5-5 01:02
所以你到底要取什么,给出原文和目标

就是要取出Unicode编码。。
 楼主| 发表于 前天 01:10 | 显示全部楼层
h20 发表于 2021-5-5 01:04
楼主想取Unicode吧

嗯,脑壳疼,,
发表于 前天 01:11 | 显示全部楼层
删除所有 U+0000 之类吗
 楼主| 发表于 前天 01:14 | 显示全部楼层
zxxx 发表于 2021-5-5 01:11
删除所有 U+0000 之类吗

嗯,但是它是一个整体,我太菜了不知道咋入手..
发表于 前天 01:18 | 显示全部楼层
查找 U\+\d\d\d\d\s*
替换 <啥也没有>
发表于 前天 01:24 | 显示全部楼层
在文本文件编辑器如EditPlus等可以试一下替换,勾选使用正则表达式:
把:
\U\+000[1-9]
替换成空

如果是js或php需要使用对应的函数
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|全球主机交流论坛

GMT+8, 2021-5-7 23:20 , Processed in 0.092796 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表