我已经在 stackoverflow / google 上搜索过这个,但似乎无法弄清楚。
我正在抓取给定 URL 页面的社交媒体链接,该函数返回一个包含 URL 列表的对象。
当我尝试将此数据写入不同的文件时,它会输出到该文件[object Object]
而不是预期的:
['https://twitter.com/#!/101Cookbooks https://twitter.com/#!/101Cookbooks',
'http://www.facebook.com/101cookbooks http://www.facebook.com/101cookbooks']
就像当我console.log()
结果。
这是我在 Node 中读写文件的悲伤尝试,尝试读取每一行(url)并通过函数调用输入request(line, gotHTML)
:
fs.readFileSync('./urls.txt').toString().split('\n').forEach(function (line){
console.log(line);
var obj = request(line, gotHTML);
console.log(obj);
fs.writeFileSync('./data.json', obj , 'utf-8');
});
供参考——gotHTML
功能:
function gotHTML(err, resp, html){
var social_ids = [];
if(err){
return console.log(err);
} else if (resp.statusCode === 200){
var parsedHTML = $.load(html);
parsedHTML('a').map(function(i, link){
var href = $(link).attr('href');
for(var i=0; i<socialurls.length; i++){
if(socialurls[i].test(href) && social_ids.indexOf(href) < 0 ) {
social_ids.push(href);
};
};
})
};
return social_ids;
};