我如何编码/解码HTML实体在Ruby?

我试图解码一些HTML实体，如'<'成为'<'。

我有一个旧的宝石(html_helpers)，但它似乎已经被抛弃了两次。

你有什么推荐吗?我需要在模型中使用它。

当前回答

HTMLEntities可以做到:

: jmglov@laurana; sudo gem install htmlentities
Successfully installed htmlentities-4.2.4
: jmglov@laurana;  irb
irb(main):001:0> require 'htmlentities'
=> []
irb(main):002:0> HTMLEntities.new.decode "&iexcl;I&#39;m highly&nbsp;annoyed with character references!"
=> "¡I'm highly annoyed with character references!"

2011-03-06 14:19:04

其他回答

如果你不想添加一个新的依赖项(比如HTMLEntities)，并且你已经在使用Hpricot，它可以为你进行转义和反转义。它处理的比CGI多得多:

Hpricot.uxs "foo&nbsp;b&auml;r"
=> "foo bär"

2011-12-06 18:13:37

HTMLEntities可以做到:

: jmglov@laurana; sudo gem install htmlentities
Successfully installed htmlentities-4.2.4
: jmglov@laurana;  irb
irb(main):001:0> require 'htmlentities'
=> []
irb(main):002:0> HTMLEntities.new.decode "&iexcl;I&#39;m highly&nbsp;annoyed with character references!"
=> "¡I'm highly annoyed with character references!"

2011-03-06 14:19:04

在Rails中，我们可以使用: ERB::Util.html_escape和ERB::Util.url_encode。在视图中，它们别名为h和u

http://ruby-doc.org/stdlib-1.9.3/libdoc/erb/rdoc/ERB/Util.html

2023-01-02 12:44:32

我认为Nokogiri宝石也是一个不错的选择。它非常稳定，有一个巨大的贡献社区。

样品:

a = Nokogiri::HTML.parse "foo&nbsp;b&auml;r"    
a.text 
=> "foo bär"

a = Nokogiri::HTML.parse "&iexcl;I&#39;m highly&nbsp;annoyed with character references!"
a.text
=> "¡I'm highly annoyed with character references!"

2014-12-18 08:27:46

<% str="<h1> Test </h1>" %>

result: &lt; h1 &gt; Test &lt; /h1 &gt;

<%= CGI.unescapeHTML(str).html_safe %>

2015-01-01 11:47:00

我如何编码/解码HTML实体在Ruby?

推荐文章

最新文章

标签