是否有可能在notepad++中删除重复的行,只留下一行的单一出现?
当前回答
在notepad++ 8.1版本中,有一个特定的命令可以精确地完成这个流行问题的要求。On可以使用菜单命令“编辑>行操作>删除重复行”删除文本文件中的重复行。
不需要安装插件(正如目前接受的答案所建议的那样),也不需要事先对行进行排序,或者像其他答案所建议的那样在Replace对话框中使用regex语法。
其他回答
带有TextFX插件的notepad++可以做到这一点,如果你想按行排序,并同时删除重复的行。
要在最新版本的notepad++中安装TextFX,您需要从这里下载:https://sourceforge.net/projects/npp-plugins/files/TextFX
TextFX插件曾经包含在旧版本的notepad++中,或者可以从菜单中添加到插件->插件管理器->显示插件管理器->可用选项卡-> TextFX ->安装。在某些情况下,它也可能被称为TextFX字符,但这是同样的事情。
需要的复选框和按钮现在将出现在菜单下:TextFX -> TextFX工具。
确保选中了“sort outputs only unique…”。接下来,选择一个文本块(Ctrl+ a选择整个文档)。最后,点击“区分大小写排序”或“不区分大小写排序”
搜索正则表达式:\b(\w+)\b([\w\ w]*)\b\1\b
替换为:$1$2
点击“替换”按钮,直到文件中不再匹配正则表达式为止。
如果行是紧挨着的,那么你可以使用正则表达式替换:
搜索模式:^(.*\r?\n)(\1)+
替换为:\1
从notepad++版本6开始,你可以在搜索和替换对话框中使用这个正则表达式:
^(.*?)$\s+?^(?=.*^\1$)
什么都不替换。这将在所有重复行中留下文件中最后一次出现的内容。
不需要排序,重复的行可以在文件中的任何地方!
您需要勾选“正则表达式”和“正则表达式”选项。匹配换行符”:
^ matches the start of the line. (.*?) matches any characters 0 or more times, but as few as possible (It matches exactly on row, this is needed because of the ". matches newline" option). The matched row is stored, because of the brackets around and accessible using \1 $ matches the end of the line. \s+?^ this part matches all whitespace characters (newlines!) till the start of the next row ==> This removes the newlines after the matched row, so that no empty row is there after the replacement. (?=.*^\1$) this is a positive lookahead assertion. This is the important part in this regex, a row is only matched (and removed), when there is exactly the same row following somewhere else in the file.
在notepad++ 8.1版本中,有一个特定的命令可以精确地完成这个流行问题的要求。On可以使用菜单命令“编辑>行操作>删除重复行”删除文本文件中的重复行。
不需要安装插件(正如目前接受的答案所建议的那样),也不需要事先对行进行排序,或者像其他答案所建议的那样在Replace对话框中使用regex语法。
推荐文章
- 在Python Pandas中删除多个列中的所有重复行
- MySQL对重复键更新在一个查询中插入多行
- 我如何检查是否有重复在一个平面列表?
- 如何将大写字母转换为小写notepad++
- 我如何在python中使用熊猫获得所有重复项的列表?
- notepad++是否显示所有隐藏字符?
- 如何在notepad++文本编辑器中更改背景颜色?
- 按列A删除重复项,保留列B中值最高的行
- 如何在PostgreSQL中找到重复的记录
- notepad++设置禁用自动打开以前的文件
- 在notepad++中找到CRLF
- 什么是最有效的方法来删除重复和排序一个向量?
- 在Ruby中删除数组中的重复元素
- 我如何配置notepad++使用空格而不是制表符?
- 删除索引重复的熊猫行