jsoup开发团队今天发布了jsoup 0.1.2下载地址,喜欢jsoup的朋友,或者需要解析HTML元素内容,过滤用户提交的不安全安的HTML代码的朋友,可以尝试一下这个优秀的HTML解析类库。
jsoup是一款开源的HTML解析类库,jsoup采用纯Java编写,jsoup提供了一组方便的API,可以通过类jQuery的方法来用于抽取、操作HTML数据。通常我们操作HTML元素的时候都是以DOM的方式操作。可以直接获得DOM中的某个Element,然后分析该Element包含有哪些属性。如果通过Java来访问,那无论是编码风格还是操作方式都有很大的变化。Java开发者面临的问题是必须通过特定的字符匹配的方式获得对应的值,或者属性。这给开发人员带来了很大的困难,或者说不习惯吧。jsoup的优势就在于可以通过Java语言以用户最习惯的DOM的方式来访问HTML元素。这大大提高了开发效率,也降低了用户收工解析HTML带来的麻烦和容易出错的问题。jsoup被设计用来处理所有类型的HTML文件,包括无效的标签解析和验证,为了避免解析过程的混乱,jsoup采用了一种有效的语法树的方式来处理HTML内容。
jsoup 0.1.2主要包括如下特性:
- jsoup支持从URL或者文件或者一个字符串中哦功能解析HTML
- jsoup支持通过DOM遍历或者CSS选择器的方式抽取查找数据
- jsoup支持操作HTML元素的属性和内容(类似直接通过DOM的方式访问HTML元素的属性)
- jsoup支持过滤用户提交数据的白名单
- jsoup 0.1.2主要是增强了对于不认识的标记的处理功能,jsoup 0.1.2中对于无法识别的标记处理将更加宽泛,更智能。
jsoup 0.1.2下载地址:
jsoup 0.1.2下载
jsoup官方主页:
jsoup
[ad#468-60]