groovy java 下载中文乱码网页办法-电脑学习网

URL url = new URL("http://fatkun.com"); // 读取源码 //读取中文时，使用Reader类是每次读出两个字节的，不会出现中文乱码 InputStreamReader in = new InputStreamReader(url.openStream(), "UTF-8"); char[] buf = new char[2048];//缓存 StringBuffer sb = new StringBuffer(); int len = 0; while ((len = in.read(buf)) != -1) {//当没到文档尽头继续读取 sb.append(buf, 0, len); }

import groovy.json.JsonSlurper;
import java.util.regex.*;
import sun.net.www.protocol.http.HttpURLConnection;
System.properties.putAll( ["http.proxyHost":"10.10.243.140", "http.proxyPort":"808"] )

URL url = new URL("http://detail.tmall.com/item.htm?spm=a220z.1000880.0.44&id=16761700638");
// 读取源码
//读取中文时，使用Reader类是每次读出两个字节的，不会出现中文乱码
InputStreamReader _in = new InputStreamReader(url.openStream(), "GBK");
char[] buf = new char[2048];//缓存
StringBuffer sb = new StringBuffer();
int len = 0;
while ((len = _in.read(buf)) != -1) {//当没到文档尽头继续读取
sb.append(buf, 0, len);
}
def html=sb.toString()
print html
def out = new File('/home/mlzboy/aaa.html')
out.append html

def cut(ohtml,start=null,end=null)
{
def html=ohtml
if(html==null || html.trim().length()==0 )
return null
if(start!=null)
{
def s=html.indexOf(start)

if(s==-1)
return null
else
html=html[s+start.length()..-1]
}

if(end!=null)
{
def e=html.indexOf(end)
if(e==-1)
return null
else
html=html[0..e-1]
}
return html
}

def r=cut(html,"货号: ","</li>")
if (r!=null && r.size()>0)
{
println r
}
else
{
println "haah"
}

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

groovy java 下载中文乱码网页办法

评论(0)

提示：请文明发言取消回复

作者信息

最近更新

2022年最新BellooV4.3.2(贝罗交友约会)php破解源码-完整的高级约会源码

wordpress 阅读量每次访问随机增加的插件

原创 WordPress 主题 C7V5 扁平化|响应式|HTML5主题

CSS 选择器权重特性

宝塔Linux面板一键挂载云服务器硬盘

Linux 系统介绍以及常用命令（零基础级别）

2022年最新wordpress日主题Ripro子主题-ziyuan-zhankr蓝色资源网主题V3.0.3子主题破解版

HTML head 头标签详细解答

groovy java 下载中文乱码网页办法

评论(0)

提示：请文明发言 取消回复

相关文章

作者信息

最近更新

提示：请文明发言取消回复