全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1052|回复: 11

[Windows VPS] 正则大佬们,这玩意儿咋过滤

[复制链接]
发表于 2021-5-5 01:00:56 | 显示全部楼层 |阅读模式
本帖最后由 笑花落半世琉璃 于 2021-5-5 01:32 编辑

夜深了,大佬们还在嘛

整了一晚上,发现不会。。

啊没描述清楚,就是要去掉有Unicode编码的,这些显示出来全是空格的效果..想问下咋取出它们,这些显示出来全是空格的效果。



内容大概是这些:

<p>aaaaaaaaaaaaaaa</p>
<p>bbbbbbbbbbbb><ul><li></li<<a></a></p>
<p>cccccc</p>


      

在vs code里面是这样的,识别为未知字符。


然后现在在用这个https://regex101.com/去整正则,大佬们快救救我。
发表于 2021-5-5 01:02:16 | 显示全部楼层
所以你到底要取什么,给出原文和目标
发表于 2021-5-5 01:02:28 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2021-5-5 01:04:05 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2021-5-5 01:08:58 | 显示全部楼层
nnt 发表于 2021-5-5 01:02
所以你到底要取什么,给出原文和目标

就是要取出Unicode编码。。
 楼主| 发表于 2021-5-5 01:10:14 | 显示全部楼层
h20 发表于 2021-5-5 01:04
楼主想取Unicode吧

嗯,脑壳疼,,
发表于 2021-5-5 01:11:09 | 显示全部楼层
删除所有 U+0000 之类吗
 楼主| 发表于 2021-5-5 01:14:00 | 显示全部楼层
zxxx 发表于 2021-5-5 01:11
删除所有 U+0000 之类吗

嗯,但是它是一个整体,我太菜了不知道咋入手..
发表于 2021-5-5 01:18:48 | 显示全部楼层
查找 U\+\d\d\d\d\s*
替换 <啥也没有>
发表于 2021-5-5 01:24:34 | 显示全部楼层
在文本文件编辑器如EditPlus等可以试一下替换,勾选使用正则表达式:
把:
\U\+000[1-9]
替换成空

如果是js或php需要使用对应的函数
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-23 18:19 , Processed in 0.065804 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表