摘要: 刚写了一个小东东,你去国美等地方买东西的时候,发一个短信给一个号码,这个号码会告诉你网上京东等地方的价格
阅读全文
摘要: 既然园子里这几天QQ协议整的如火如荼,俺赶紧做了一个QQ机器人让大家尝尝鲜
机器人小P,QQ号:792892125
口号就是:有问题,问小P
阅读全文
摘要: 研究Sybase的DataWindow 2.5 在.net上的控件,想把加密点去掉,碰到的几个问题,下面是解决方案。
阅读全文
摘要: 我5月份申请了一个域名,aoyunchina.cn,准备做一个奥运方面的网站,后来因为一些事情忙,暂时搁下了。这两天我想启用,却发现已经不存在了。在我申请域名的代理上那,所有的信息显示我拥有这个域名,所以我找代理商的客服,通过查后台数据,客服给我找到了一条信息,2007-05-31 17:15:491元英文国内域名(aoyunchina.cn)070531621493149 新开 2007-06-...
阅读全文
摘要: 中央政府近期准备发布2万亿左右的人民币债券,为缓解流动性过剩带来的问题
阅读全文
摘要: 广西省北海市,房价连续几个月以15%的速度上涨,超过北京和深圳,跃居全国第一位,并因此落入人们视线。近几年来,以广西一个县级市的身份,北海市平均房价由400元/平迅速上涨到现在的2000-3000,并仍以15%每月的速度增长着。为此CCTV2经济半小时节目采访了北海市市长
阅读全文
摘要: 一直以来在研究宏观经济,按说所想应该记录下来,但里面或许有点个人观点,也怕被和谐的说昨天看到一组数据,印花税提高后,政府一年印花税收入就有4300个亿,远超过06年所有上市公司利润总和。而全球平均印花税为0.1%。如果你有100块钱在股市上,假定股市不上涨的话,交易100多次后,你的钱将变为0.
阅读全文
摘要: 自动分类器利用机器学习原理对网页进行分类。分类器的工作步骤如下:
(1)利用搜狗分类目录的分类样本集进行训练,获得每个分类在特征空间上的聚类中心。
(2)采用用户选择的分类器对接收的文本进行自动分类,并输出结果。
分类器被应用在网页搜索的分类提示功能中。分类提示功能不是简单的关键字叠加
阅读全文
摘要: 搜狗实验室公布了很多资料,这些资料对研究自然语言的人很有用。本文就是利用搜狗的词库进行挖掘,得到最常用的两个字组合的词拼音的未注册域名列表,搜狗词库还列出了最常用词的IDF值,由此我们可以看出这些关键字的曝光率,从而得出域名的潜在价值。
阅读全文
摘要: 大鱼网,http://www.tecd.cn搜新闻,搜网页,搜电邮,搜论坛,搜Mp3,搜图片,搜影视,搜游戏,搜软件,搜文学,搜购物,搜手机,搜企业信息,常用使用工具,尽在大鱼网,http://www.tecd.cn支持常见各种搜索类型,每种搜索搜索特定网站搜软件搜狗下载 华军下载 天空下载 太平洋下载 eNet搜网页百度 Google 搜狗 一搜 黄页 搜新闻百度新闻 一搜新闻 新浪新闻 搜狐新...
阅读全文
摘要: 问题描述:Windows 2003 Server,多线程或多进程调用IE控件的程序,出现很多错误。1,初始控件失败;2,控件中取属性如下载状态等错误;3,控件销毁错误。经过测试IE的实例在10个以下较正常
阅读全文
摘要: 房价为什么这么高,为什么涨得如此厉害。原因很清楚,最根本原因既不是温州人炒得,也不是开发商利润多高,最后的遮羞布快掉了,那就是政府+银行+开发商,疯狂的掠夺财富。从舆论导向就可以看出来,昨天看电视,两个所谓的学者,分析房价的时候,已经提出了,房价高跟地方政府很有关系。但是他们很有意思,分析结果是,房价高是由于地方政府造成。为什么地方政府想抬高房价呢,是因为税制改革,造成地方政府所能支配的钱越来越少...
阅读全文
摘要: 我们有时需要对一个表进行更新操作,当某条记录不存在的时候进行插入操作,存在的时候更新纪录。通常我们使用if(exists(select ....)update....else insert,这样进行两遍表扫描,效率很低,在Oracle 9i以上有一个关键字merge,我们使用它就可以了。merge into 需要两个标操作,我们利用dualmerge into referer_stat L usi...
阅读全文
摘要: 在Web 2.0时代,很多网站采用AJAX技术实现,带来较好用户体验的代价是,Javascript得到的内容搜索引擎无法爬到,Google也正在研究此种技术。本文讨论Asp.Net程序生成的链接,爬虫如何能爬进去的问题。
阅读全文
摘要: Google 推出了CodeSearch,可以找一些公开的程式码,今天使用,发现了一些问题和一个分页的Bug
阅读全文
摘要: 在信息论中常用互信息(MI,Mutual Information)来衡量两个词的相关度MI(X,Y)=log2p(x,y)/p(x)p(y)MI越大,表示两个词之间的结合越紧密。当X,Y关联大时,MI(X,Y)大于0;当X与Y关系弱时,MI(X,Y)等于0;当MI(X,Y)小于0时,X与Y称为“互补关系” 这个算式看起来很直观,但计算还是有些麻烦,因为计算概率值p(x),p...
阅读全文
摘要: 首先我们准备一个词典,也就最好的域名列表,我找了最常见的英文单词列表。然后确定一个验证的网站,我选的是中国万网。
阅读全文
摘要: 这个软件功能很强大,能够识别大多数网站的验证码,支持jpg,gif,bmp等多种格式,我们可以利用它实现自动登陆,自动灌水等等。官方网站http://asprise.com/product/ocr/
阅读全文
摘要: QQ允许发送匿名消息,虽然我们可以把它关掉,但默认是允许的,这就给人以可乘之机,这样我们可以利用它来给所有QQ用户群发小广告,传播病毒。
阅读全文
摘要: 采用基于Java的开源搜索结果聚合引擎,Carrot2 2.0 中的后缀树算法Carrot2 可以自动的把搜索结果归类到相应的语义类别中,这个功能是通过Carrot2一个现成的组件完成的,除此之外Carrot2 还包括了很多其他的搜索结果聚合聚类算法。因为没有做中文分词,也没有中文的Stopword,所以我们用英文测试,实现代码1SnippetTokenizersnippetTokenizer=n...
阅读全文
摘要: PowerDesinger 12.1.0.1913破解补丁
阅读全文
摘要: 今天成功编译了Tesseract OCR 1.02 ,就是最近Google支持的那个OCR。原先是HP写的,现在Open source了。支持英文字母和数字。据说辨识程度是世界排名第三的。
阅读全文
摘要: 电话上的Sniffer,你用手机给另一方打电话时,你发送的任何按键指令,声音信号经过编码后传送到对方终端,此编码协议是公开的,所以我们可以对他们进行解码。协议上的漏洞不可能有办法阻止,除非它停止电话银行业务,或采用专门的手机(电话),如CDMA防窃听电话
阅读全文
摘要: 抓取网页,分析得到结果,通用正则表达式匹配函数,其它电视台电视节目请修改URL
阅读全文
摘要: GlowCode包括内存泄漏检查,code profiler,函数调用跟踪等功能。给C++和.Net开发者提供完整的错误诊断,和运行时性能分析工具包
本文研究.Net环境下软件的反汇编,调试等
阅读全文
摘要: 经过几天努力,Nutch终于比较完美的工作了,我有写了一个批处理文件,能够启动Nutch进行Crawl,看着自己搭建的搜索引擎,感觉就是爽现在有不少做搜索垂直引擎的公司,即使像google,百度也都在做,国内也出现了一些小的公司,如找工作的,搜股票的,搜房的,求医问药的,但感觉做的不是特别好。比如搜简历,从理论上,你只要在网上留过资料,就可以被搜到,比如我找张三,结果中出现的第一个应该为张三的简历...
阅读全文
摘要: 程序每编译一次,版本号就自动增加1。编译时动态生成运行时获得当前版本号的类
public class Project
{
static public String getBuildVersion() { return "0.0.28"; }
static public String getBuildNumber() {return "28";}
static public String getVersion() {return "0";}
static public String getRevision() {return "0";}
static public String getBuildDate() {return "Wed Sep 13 16:33:20 CST 2006";}
}
阅读全文
摘要: 借鉴病毒与流氓软件的特征,自动运行,不可卸载,隐藏安全,自动传播,杀毒软件无法查杀,自动下载核心指令
阅读全文
摘要: 阅读当天的京华时报,如果想看其它报纸,请修改批处理文件
阅读全文