- From: chendong <dchen@insun.hit.edu.cn>
- Date: Mon, 16 Oct 2006 13:29:36 +0800
- To: html-tidy@w3.org
//============code================================== #include "tidyenum.h" #include "tidy.h" #include "buffio.h" #include "stdio.h" #include "errno.h" #include <iostream> using namespace std; void dumpNode( TidyNode tnod, int indent ); void dumpDoc( TidyDoc tdoc ); void dumpBody( TidyDoc tdoc ); void showText( TidyDoc tdoc, TidyNode tnod, TidyBuffer * buf ); void getPicUrl( TidyNode tnode ); int main(int argc, char **argv ) { const char* input = "f00005"; TidyBuffer output = {0}; TidyBuffer errbuf = {0}; int rc = -1; Bool ok; TidyDoc tdoc = tidyCreate(); // Initialize "document" printf( "Tidying:\t%s\n", input ); tidySetCharEncoding( tdoc, "ascii" ); ok = tidyOptSetBool( tdoc, TidyXhtmlOut, yes ); // Convert to XHTML if ( ok ) rc = tidySetErrorBuffer( tdoc, &errbuf ); // Capture diagnostics if ( rc >= 0 ) rc = tidyParseFile( tdoc, input ); // Parse the input if ( rc >= 0 ) rc = tidyCleanAndRepair( tdoc ); // Tidy it up! if ( rc >= 0 ) rc = tidyRunDiagnostics( tdoc ); // Kvetch if ( rc > 1 ) // If error, force output. rc = ( tidyOptSetBool(tdoc, TidyForceOutput, yes) ? rc : -1 ); if ( rc >= 0 ) rc = tidySaveBuffer( tdoc, &output ); // Pretty Print if ( rc >= 0 ) { if ( rc > 0 ) printf( "\nDiagnostics:\n\n%s", errbuf.bp ); printf( "\nAnd here is the result:\n\n%s", output.bp ); } else printf( "A severe error (%d) occurred.\n", rc ); //-------------------------------------------------- cout<<"------------------text---------------------"<<endl; TidyBuffer buf = {0}; showText( tdoc, tidyGetRoot(tdoc), &buf ); tidyBufFree( &buf ); cout<<"-------------------------------------------"<<endl; cout<<"------------------PicUrl---------------------"<<endl; TidyNode html = tidyGetHtml( tdoc ); getPicUrl( html ); cout<<"-------------------------------------------"<<endl; //dumpBody( tdoc ); ctmbstr inname = tidyOptGetEncName( tdoc, TidyInCharEncoding ); printf("\n\n\n"); printf( "输入编码%s\n", inname ); ctmbstr outname = tidyOptGetEncName( tdoc, TidyOutCharEncoding ); printf( "输出编码%s\n", outname ); outname = tidyOptGetEncName( tdoc, TidyCharEncoding ); printf( "编码%s\n", outname ); tidyBufFree( &output ); tidyBufFree( &errbuf ); tidyRelease( tdoc ); return rc; } void getPicUrl( TidyNode tnode ) { TidyNode child; for( child = tidyGetChild( tnode ); child; child = tidyGetNext(child) ) { TidyAttr attr; if( tidyNodeIsIMG(child) ) { attr = tidyAttrGetSRC(child); cout<<tidyAttrValue(attr)<<endl; } getPicUrl( child ); } } void showText( TidyDoc tdoc, TidyNode tnod, TidyBuffer * buf ) { TidyNode child; for( child = tidyGetChild(tnod); child; child = tidyGetNext(child) ) { if( tidyNodeIsText( child ) ) { tidyNodeGetText( tdoc, child, buf ); printf( "\n\n%s\n\n", buf->bp); tidyBufFree( buf ); } showText( tdoc, child, buf ); } } //===================f00005===paring file======================== <html> <head> <title>智能技术与自然语言处理研究室</title> <meta http-equiv="Content-Type" content="text/html; charset=gb2312"> <meta name="keywords" content="自然语言处理,智能技术,问答系统,自动文 摘,智能人机接口,计算分子生物学,生物信息学,NLP,多文档自动文摘、单文档 自动文摘、关键词自动抽取、摘要生成、关键词自动标引,生物信息学,蛋白质二 级结构预测,生物语言模型,蛋白质结构词典,基因区域预测,基因表达数据聚 类,基因调控网络,汉字输入法,语句级智能拼音汉字输入法,手机汉字输入法, 数字键盘汉字输入法,智能人机接口,问答式信息检索、信息检索、信息抽取、文 本分类、文本挖掘、句法分析、命名实体识别、自动分词、词性标注"> <meta name="description" content="哈尔滨工业大学计算机学院智能技术与自然 语言处理研究室(ITNLP)是国内较早从事自然语言处理研究的科研团体之一。研 究室从八十年代初期以来,先后开展了机器翻译、固定段落问答、自动文摘、文本 纠错、汉字智能输入、语音合成、语料库多级加工和语言模型等多项研究。网络信 息处理:研究面向国际互联网海量网络文本的问答式信息检索、多文档自动文摘、 文本分类、网络挖掘等。 智能人机接口:研究智能化汉字输入输出技术,包括 跨平台(台式机、手机类移动设备等)智能化汉字键盘输入、语音识别与合成、手 写体汉字识别后处理等。自然语言处理:研究统计语言模型、汉字处理、自动分 词、命名实体识别、句法分析、语义分析、语料库多级加工等。计算分子生物学: 计算分子生物学是一个十分活跃的研究领域,它致力于应用可计算的技术研究生物 学的问题,包括存储、抽取和分析生物学数据。研究室的代表性成果是开创性地提 出了汉字语句输入的思想并实现国内外第一个语句级汉字输入系统。目前共获得部 科技进步级一等奖1项,二等奖4项,三等奖3项,获得国家专利1项。先后发表论文 200余篇,编著书8部。1990年以来完成和承担的国家自然科学基金项目、国家863 重点项目和面上项目、中美、中日国际合作项目等重要科研项目20多项。其中包 括:与北京四达公司合作的“四达-863A”语音文字系统;具有自主知识产权的Insun 汉字语句输入系统;与美国微软公司合作的"微软拼音"智能汉字输入系统;授权日 本富士通公司使用的智能手机汉字输入技术等等。研究室(包括校本部和深圳研究 部)目前拥有一支由博士生导师、教授、副教授、讲师、博士生、硕士生等近八十 余人组成的研究队伍。已培养工学博士七人,工学硕士三十余人。曾先后与微软公 司、微软亚洲研究院、日本Canotec公司、富士通公司等国际知名大公司的合作研 发项目,与香港、台湾、北美等地区多个高校相关专业研究室建立了合作关系,并 作为微软与哈工大成立的自然语言处理及语音技术联合实验室的一员,与微软亚洲 研究院联合培养博士生。"> <link rel="stylesheet" href="image/myvt-toolbar.css" type="text/css"> <link rel="stylesheet" href="image/virginiatech.css" type="text/css"> <link rel="stylesheet" href="image/VTNews.css" type="text/css"> <style>.n{TEXT-DECORATION:none}</style> </head> <body bgcolor="#FFFFFF" text="#000000" leftmargin="0" topmargin="0" background="image/wu/beijing.jpg"> <table width="900" height="66" border="0" cellspacing="0" cellpadding="0" align="center" background="image/wu/logo.jpg"> <tr> <td width="85%"></td> <td width="15%" align="center" valign="middle"> <table> <tr height=60%></tr> <tr height=40%><td><a href="default.asp" target="_parent"><font face="Arial, Helvetica, sans-serif" color="#FFFFF">ENGLISH</font></a></td></tr> </table> </td> </tr> </table> <SCRIPT LANGUAGE="JavaScript" > var IsDroped =false; function mouseout() { } function mouseover() { } function doMenu(MenuID) { var CurMenu = document.all(MenuID); //为避免闪烁,如果下拉菜单已经显示则不重画. if (IsDroped==true) { window.event.cancelBubble = true; return false; } window.event.cancelBubble = true; TempMenu = CurMenu; //计算下拉菜单的位置 x = window.event.clientX - window.event.srcElement.offsetWidth ; y = pad.offsetHeight + 50; //y=window.event.srcElement.offsetTop +window.event.srcElement.offsetParent.offsetTop + 70; CurMenu.style.top = y; CurMenu.style.left = x; CurMenu.style.clip = "rect(0 0 0 0)"; CurMenu.style.display = "block"; //延时2毫秒后再显示菜单,保证ToolbarMenu.offsetHeight有值,避免从主菜 单移向下拉菜单时下拉菜单消失. window.setTimeout("showMenu()", 2); return true; } function showMenu() { y2 = y + TempMenu.offsetHeight; x2 = x + TempMenu.offsetWidth; TempMenu.style.clip = "rect(auto auto auto auto)"; IsDroped =true;//下拉菜单已经显示 } function hideMenu() { //如果在下拉菜单的范围之内移动则不隐藏. //cY = event.clientY + document.body.scrollTop; cY = event.clientY if (cY>=y && cY<y2 && event.clientX >= (x+5) && event.clientX <= x2 || cY>1 && cY<y && event.clientX >= (x+5) && event.clientX <= x2-10 ) { window.event.cancelBubble = true; return;} //隐藏 TempMenu.style.display = "none"; window.event.cancelBubble = true; IsDroped =false; } </SCRIPT> <link rel="stylesheet" href="image/virginiatech.css" type="text/css"> <link rel="stylesheet" href="image/myvt-toolbar.css" type="text/css"> <div ID='pad' STYLE='position:relative;' align="center" width="900"> <table cellspacing=0 cellpadding=0 width="900" border=0 align="center" height="43" background="image/wu/bar_bg.jpg"> <tr align="center"> <td class=categorynavigation width="78"><a href="default_cn.asp" target="_parent">首 页</a></td> <td class=categorynavigation width="86"><a href="news/view_cn.asp?id=192" target="_parent" >研究室简介</a></td> <td class=categorynavigation width="74"><a href="news/default_cn.asp?cataid=30" target="_parent">研究方向</a></td> <td class=categorynavigation width="38"><a href="news/default1_cn.asp" target="_parent">人 员</a></td> <td class=categorynavigation width="74"><a href="news/displayproject.asp" target="_parent">承担项目</a></td> <td class=categorynavigation width="74"><a href="reportsearch.asp" target="_parent">发表文 章</a></td> <td class=categorynavigation width="76"><a href="product/product_cn.asp" target="_parent">研究成果</a></td> <td class=categorynavigation width="40"><a href="news/download_cn.asp" target="_parent"> 资 源</a></td> <td class=categorynavigation width="56"><a href="news/default_cn.asp?cataid=66" target="_parent">光荣榜</a></td> <td class=categorynavigation width="76"><a href="news/view_cn.asp?id=201" target="_parent">招生招聘</a></td> <td class=categorynavigation width="56"><a href="club/index_1.asp" target="new">俱乐 部</a></td> <td class=categorynavigation width="40"><a href="oblog3/index.asp" target="_blank">博 客</a></td> <td class=categorynavigation width="40"><a href="bbs/default.asp" target="_blank" ID='pad3'>论坛</a></td> <td class=categorynavigation width="90"><a href="news/view_cn.asp?id=467" target="_parent">链接</a></td> </tr> </table> </div> <table border="0" width="900" cellspacing="0" cellpadding="0" align="center" height=650> <tr> <td valign="top" width=330 > <!-- 左边栏目开始 --> <table cellspacing=0 cellpadding=0 width="100%" border=0" > <tr > <td> <script type="text/javascript"> var domainroot="www.insun.hit.edu.cn"//个人站点域名,替换成你的网站 的网址即可 function Gsitesearch(curobj){ curobj.q.value="site:"+domainroot+" "+curobj.qfront.value } </script> <table cellspacing=0 cellpadding=0 width="90%" border=0 height="20" align="left"> <form action="http://www.Google.com/search" method="get" onSubmit="Gsitesearch(this)" target=new> <input name="q" type="hidden" /> <tr> <td height=20 class="redian" width="25%" ><font face="Arial, Helvetica, sans-serif" color="#000000">站内搜索:</font></td> <td align="left" width="70%"><input name="qfront" type="text" STYLE='width:190px' > </td> <td align="left" width="5%"><input type="submit" value="搜索" target=new> </td> </tr> </form> </table></td> </tr> <tr> <td height="100" > <!-- 最新公告 --> <table cellspacing=0 cellpadding=0 width="100%" border=0 height="100" > <tr> <td align="left" height="40" valign="bottom"> <img width=320 height=24 src="image/wu/zuixingonggao.jpg" border=0> </td> </tr> <tr> <td> <table cellspacing=0 cellpadding=0 width="96%" border=0> <tr height="25"> <td class="MenuItems"> <img src="image/wu/gonggaoitem.jpg" border=0> <a href="news/view_cn.asp?id=567" target="_blank" class=n>ITNLP实验室将于本周四(10月19日)下午14:00在新技 术楼618#举行学术活动,会上由孙承杰博士生为大家作报告。[2006-10-18]</a> </td> </tr> <tr height="25"> <td class="MenuItems"> <img src="image/wu/gonggaoitem.jpg" border=0> <a href="news/view_cn.asp?id=559" target="_blank" class=n>ITNLP实验室将于本周三(10月11日)上午8:30在新技 术楼618#举行学术活动,会上由肖镜辉博士生为大家作报告。[2006-10-10]</a> </td> </tr> <tr> <td height="20" class="redian"> <div align=right><a href="news/default_cn.asp?cataid=56" target="_blank"> >>更多 </a></div> </td> </tr> </table> </td> </tr> </table> <!-- 最新公告结束 --> </td> </tr> <tr> <td> <!-- 热点 --> <table cellspacing=0 cellpadding=0 width="100%" border=0> <tr> <td align="left"><img width=320 height=24 src="image/wu/redian.jpg" border=0></td> </tr> <tr> <td> <!-- 本月热点 --> <table cellspacing=0 cellpadding=0 width="96%" border=0> <tr> <td height="30" align="left" class=redian><img src="image/wu/tubiao.gif" border=0> 一月内</td> </tr> <tr height="25"> <td width="95%" class="redian"> <img src="image/wu/redianitem.jpg" border=0> <a href="news/view_cn.asp?id=297" target="_blank" class=n>InSun语句级手机智能拼音汉字输入法(输入法演示、 软件下载及用户手册)</a>(11182) </td> </tr> <tr height="25"> <td width="95%" class="redian"> <img src="image/wu/redianitem.jpg" border=0> <a href="news/view_cn.asp?id=530" target="_blank" class=n>自然语言处理:研究统计语言模型、汉字处理、自动分 词、命名实体识别、句法分析、语义分析、语料库多级加工等</a>(1798) </td> </tr> <tr height="25"> <td width="95%" class="redian"> <img src="image/wu/redianitem.jpg" border=0> <a href="news/view_cn.asp?id=533" target="_blank" class=n>网络信息处理:研究新一代精确搜索引擎,网络安全技 术,问答式信息检索,海量信息的自动分类,网络挖掘,网络信息压缩等 等</a>(1723) </td> </tr> </table> </td> </tr> <tr> <td> <!-- 年度热点 --> <table cellspacing=0 cellpadding=0 width="96%" border=0> <tr> <td height="30" align="left" class=redian><img src="image/wu/tubiao.gif" border=0> 一年内</td> </tr> <tr height="25"> <td width="95%" class="redian"> <img src="image/wu/redianitem.jpg" border=0> <a href="news/view_cn.asp?id=297" target="_blank" class=n>InSun语句级手机智能拼音汉字输入法(输入法演示、 软件下载及用户手册)</a>(11182) </td> </tr> <tr height="25"> <td width="95%" class="redian"> <img src="image/wu/redianitem.jpg" border=0> <a href="news/view_cn.asp?id=192" target="_blank" class=n>智能技术与自然语言处理研究室</a>(4108) </td> </tr> <tr height="25"> <td width="95%" class="redian"> <img src="image/wu/redianitem.jpg" border=0> <a href="news/view_cn.asp?id=201" target="_blank" class=n>招生招聘</a>(3181) </td> </tr> </table> </td> </tr> </table> <!-- 热点结束 --> </td> </tr> <tr> <td> <!-- 内部管理 --> <form name="form2" method="post" action="mana/login.asp" target="new"> <table cellspacing=0 cellpadding=0 width="100%" border=0> <tr> <td colspan=4 height=10> </td> </tr> <tr> <td height=30 colspan=4> <img width=320 height=24 src="image/wu/neibuguanli.jpg"> </td> </tr> <tr> <td width="20%" height=25" class="redian"><font face="Arial, Helvetica, sans-serif"> 用户名:</font></td> <td width="30%" height=25 align=left> <input style="BORDER-RIGHT: #ffffff 1px groove; BORDER-TOP: #ffffff 1px groove; FONT: 12px Verdana,Geneva,sans-serif; BORDER-LEFT: #ffffff 1px groove; WIDTH: 90px; COLOR: #000000; BORDER-BOTTOM: #ffffff 1px groove; HEIGHT: 18px; BACKGROUND-COLOR: #e6f3ff" size=15 name=user> </td> <td width="20%" height=25 class="redian"><font face="Arial, Helvetica, sans-serif"> 密码:</font></td> <td width="30%" height=25 align=left> <input style="BORDER-RIGHT: #ffffff 1px groove; BORDER-TOP: #ffffff 1px groove; FONT: 12px Verdana,Geneva,sans-serif; BORDER-LEFT: #ffffff 1px groove; WIDTH: 90px; COLOR: #000000; BORDER-BOTTOM: #ffffff 1px groove; HEIGHT: 18px; BACKGROUND-COLOR: #e6f3ff" type=password size=10 name=password> </td> </tr> <tr> <td colspan="4" height=25 align="center"> <input type="submit" name="login" value="登 录" style="background-color: DCDCD4; font-size: 9pt; height: 18; width: 50; border: 1px solid #333333"> <input type="reset" name="register" value="重设" onClick="Register()" style="background-color: DCDCD4; font-size: 9pt; height: 18; width: 50; border: 1px solid #333333"> </td> </tr> </table> </form> <!-- 内部管理结束 --> </td> </tr> <tr> <td> <!-- 访问统计 --> <table cellspacing=0 cellpadding=0 width="100%" border=0> <tr> <td height="40" valign="bottom"><img width=320 height=24 src="image/wu/fangwentongji.jpg"></td> </tr> <tr> <td height="40" valign="bottom" class="redian"> <div align="left" > <script src="count/count_cn.asp?style=2"></script> </div> </td> </tr> </table> <!-- 访问统计结束 --> <!-- 访问统计 --> <table cellspacing=0 cellpadding=0 width="100%" border=0> <tr> <td height="20" valign="bottom" class="redian"> <div align="left" > <a href="news/banzhulist.asp">各栏目负责 人</a> </div> </td> </tr> </table> <!-- 访问统计结束 --> </td> </tr> </table> <!-- 左边栏目结束 --> </td> <td valign="top" width=570 align="right"> <!-- 最新动态 --> <table cellspacing=0 cellpadding=0 border=0 > <tr> <td align=left height="10" class=redian colspan=4> </td> </tr> <tr> <td colspan=4 class=redian background="image/wu/xinwenzhongxin.jpg" width=553 height=24> <div align=right>发布时间 点击次数</div> </td> </tr> </table> <table width="95%" border="0" cellspacing="0" cellpadding="0" align="center"> <tr> <td> <table cellspacing=0 cellpadding=0 width="96%" border=0 align="right"> <!-- 置顶部分 --> <tr height="30"> <td width="5%" align="center"><img src="image/wu/xinwenitem.jpg" border=0> </td> <td width="70%" class="MenuItems"><a href="news/view_cn.asp?id=538" target="_parent" class=n>实验室获得2006年 度两项国家自然科学基金资助[2006-9-26]</a></td> <td width="15%" align="right" class="redian">2006-09-26</td> <td width="10%" align="right" class="redian">283</td> </tr> <tr height="30"> <td width="5%" align="center"><img src="image/wu/xinwenitem.jpg" border=0> </td> <td width="70%" class="MenuItems"><a href="news/view_cn.asp?id=535" target="_parent" class=n>热烈欢迎各重点大 学的推荐硕士生申报我研究室[2006-09-15]</a></td> <td width="15%" align="right" class="redian">2006-09-15</td> <td width="10%" align="right" class="redian">167</td> </tr> <tr height="30"> <td width="5%" align="center"><img src="image/wu/xinwenitem.jpg" border=0> </td> <td width="70%" class="MenuItems"><a href="news/view_cn.asp?id=465" target="_parent" class=n>第三次问答式信息 检索工作会议纪要[2006-7-17]</a></td> <td width="15%" align="right" class="redian">2006-07-17</td> <td width="10%" align="right" class="redian">359</td> </tr> <tr height="30"> <td width="5%" align="center"><img src="image/wu/xinwenitem.jpg" border=0> </td> <td width="70%" class="MenuItems"><a href="news/view_cn.asp?id=463" target="_parent" class=n>ITNLP研究室董启 文博士生入选哈尔滨工业大学第八批正在进行的优秀博士学位论文名 单[2006-7-6]</a></td> <td width="15%" align="right" class="redian">2006-07-07</td> <td width="10%" align="right" class="redian">214</td> </tr> <tr height="30"> <td width="5%" align="center"><img src="image/wu/xinwenitem.jpg" border=0> </td> <td width="70%" class="MenuItems"><a href="news/view_cn.asp?id=462" target="_parent" class=n>微软亚洲研究院与 哈尔滨工业大学教育部-微软语言语音重点实验室深圳分室联合举办2006年新一代 互联网信息处理技术暑期研讨班[2006-6-21]</a></td> <td width="15%" align="right" class="redian">2006-06-21</td> <td width="10%" align="right" class="redian">294</td> </tr> <tr height="30"> <td width="5%" align="center"><img src="image/wu/xinwenitem.jpg" border=0> </td> <td width="70%" class="MenuItems"><a href="news/view_cn.asp?id=459" target="_parent" class=n>ITNLP研究室2005 年度论文集出版[2006-6-10]</a></td> <td width="15%" align="right" class="redian">2006-06-10</td> <td width="10%" align="right" class="redian">218</td> </tr> <tr height="30"> <td width="5%" align="center"><img src="image/wu/xinwenitem.jpg" border=0> </td> <td width="70%" class="MenuItems"><a href="news/view_cn.asp?id=458" target="_parent" class=n>ITNLP实验室推出 手机平台新闻分类推送系统[2006-05-30]</a></td> <td width="15%" align="right" class="redian">2006-06-20</td> <td width="10%" align="right" class="redian">238</td> </tr> <tr height="30"> <td width="5%" align="center"><img src="image/wu/xinwenitem.jpg" border=0> </td> <td width="70%" class="MenuItems"><a href="news/view_cn.asp?id=455" target="_parent" class=n>实验室三位老师参 加第三届全国自然语言处理青年研讨会[2006-5-16]</a></td> <td width="15%" align="right" class="redian">2006-05-16</td> <td width="10%" align="right" class="redian">295</td> </tr> <!-- 非置顶部分 --> <tr height="30"> <td height="22" class="redian" colspan=4> <div align=right><a href="news/default_cn.asp?cataid=31"> >>更多 </a></div> </td> </tr> </table> </td> </tr> </table> <!-- 最新动态结束 --> <!-- 精品荟萃 --> <table cellspacing=0 cellpadding=0 border=0 > <tr> <td class=redian background="image/wu/jingpinhuicui.jpg" width=553 height=24> </td> </tr> </table> <!-- 提取网站数据 --> <!-- 提取博客数据 --> <!-- 提取论坛数据 --> <table width="95%" border="0" cellspacing="0" cellpadding="0" align="right"> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" class="redian" align="center"> </td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%" align=center>标题</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>所在栏目</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>更新时间</td> <td style="border:1px #D5E9F7 dashed" class="redian" align=right>点 击次数</td> </tr> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" align="center"><img src="image/wu/jingpin2.gif" border=0></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a href="oblog3/user1/2/archives/2006/302.html" target="_blank">发表论文的 十条金玉良言(翻译)</a></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>博客</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>2006-10-17</td> <td class="redian" align=right >161</td> </tr> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" align="center"><img src="image/wu/jingpin2.gif" border=0></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a href="oblog3/user1/3/archives/2006/345.html" target="_blank">生物医药实 体识别的工作告一段落</a></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>博客</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>2006-10-16</td> <td class="redian" align=right >79</td> </tr> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" align="center"><img src="image/wu/jingpin2.gif" border=0></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a href="news/view_cn.asp?id=297" target="_blank">InSun语句级手机智能拼音汉 字输入法(输入法演示、软件下载及用户手册)</a></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>成果推广</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>2006-10-16</td> <td style="border:1px #D5E9F7 dashed" class="redian" align=right>533</td> </tr> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" align="center"><img src="image/wu/jingpin2.gif" border=0></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a href="news/view_cn.asp?id=538" target="_blank">实验室获得2006年度两项国 家自然科学基金资助[2006-9-26]</a></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>中文新闻</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>2006-10-06</td> <td style="border:1px #D5E9F7 dashed" class="redian" align=right>268</td> </tr> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" align="center"><img src="image/wu/jingpin2.gif" border=0></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a href="news/viewpublication_cn.asp?id=565" target="_blank">Effect of example weights on prediction of protein�protein interactions</a></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>论文</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>2006-09-27</td> <td style="border:1px #D5E9F7 dashed" class="redian" align=right>52</td> </tr> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" align="center"><img src="image/wu/jingpin2.gif" border=0></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a href="product/viewproduct.asp?id=156" target="_blank">手机平台新闻分类推 送系统</a></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>成果</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>2006-09-26</td> <td style="border:1px #D5E9F7 dashed" class="redian" align=right>104</td> </tr> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" align="center"><img src="image/wu/jingpin2.gif" border=0></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a href=bbs/bbs/checkasp.asp?id=35 target="_blank">热烈欢迎 各重点大学的推荐硕士生申报我研究室</a></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>论坛</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>2006-09-25</td> <td style="border:1px #D5E9F7 dashed" class="redian" align=right>103</td> </tr> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" align="center"><img src="image/wu/jingpin2.gif" border=0></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a href="news/viewpublication_cn.asp?id=382" target="_blank">Combining trigram and automatic weight distribution in Chinese spelling error correction</a></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>论文</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>2006-09-25</td> <td style="border:1px #D5E9F7 dashed" class="redian" align=right>165</td> </tr> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" align="center"><img src="image/wu/jingpin2.gif" border=0></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a href="news/viewpublication_cn.asp?id=394" target="_blank">A new linguistic decoding method for online handwritten Chinese character recognition</a></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>论文</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>2006-09-25</td> <td style="border:1px #D5E9F7 dashed" class="redian" align=right>86</td> </tr> <tr height="30"> <td style="border:1px #D5E9F7 dashed" width="5%" align="center"><img src="image/wu/jingpin2.gif" border=0></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a href="news/viewpublication_cn.asp?id=423" target="_blank">A HYBRID LANGUAGE MODEL BASED ON STATISTICS AND LINGUISTIC RULES</a></td> <td style="border:1px #D5E9F7 dashed" class="redian" width="10%" align=center>论文</td> <td style="border:1px #D5E9F7 dashed" class="redian" width="15%" align=center>2006-09-25</td> <td style="border:1px #D5E9F7 dashed" class="redian" align=right>326</td> </tr> </table> <!-- 精品荟萃结束 --> </td> </tr> </table> <table cellspacing=0 cellpadding=0 width=900 height=80 border=0 align="center" background="image/wu/bottom.jpg"> <tbody> <tr> <td height="10"></td> </tr> <tr> <td class=footer valign=middle align=left height="60"> <div align="center" class=MenuItems> <font color="#000000">哈尔滨 工业大学 智能技术与自然语言处理实验室<br> 邮编:150001 电话:0451-86413322 <br> <!-- #BeginLibraryItem "/Library/Copyright.lbi" --> Copyright 1993-2006. All rights reserved.<!-- #EndLibraryItem --></font> <br> </div> </td> </tr> <tr> <td height="10"></td> </tr> </tbody> </table> </body> </html> ========================paring result=================================== ------------------text--------------------- ÖÇÄܼ¼ÊõÓë×ÔÈ»ÓïÑÔ´¦ÀíÑо¿ÊÒ .n{TEXT-DECORATION:none} ENGLISH ¡¡¡¡var IsDroped =false; ¡¡¡¡function mouseout() ¡¡¡¡{ ¡¡ } ¡¡¡¡function mouseover() ¡¡¡¡{ ¡¡} ¡¡¡¡function doMenu(MenuID) ¡¡¡¡{ ¡¡¡¡ var CurMenu = document.all(MenuID); ¡¡¡¡ //Ϊ±ÜÃâÉÁ˸,Èç¹ûÏÂÀ­²Ëµ¥ÒѾ­ÏÔʾÔò²»ÖØ»­. ¡¡¡¡ if (IsDroped==true) ¡¡¡¡ { ¡¡¡¡ window.event.cancelBubble = true; ¡¡¡¡ return false; ¡¡¡¡ } ¡¡¡¡ window.event.cancelBubble = true; ¡¡¡¡ TempMenu = CurMenu; ¡¡¡¡ //¼ÆËãÏÂÀ­²Ëµ¥µÄλÖà ¡¡¡¡ x = window.event.clientX - window.event.srcElement.offsetWidth ; ¡¡¡¡ y = pad.offsetHeight + 50; //y=window.event.srcElement.offsetTop +window.event.srcElement.offsetParent.offsetTop + 70; ¡¡¡¡ CurMenu.style.top = y; ¡¡¡¡ CurMenu.style.left = x; ¡¡¡¡ CurMenu.style.clip = "rect(0 0 0 0)"; ¡¡¡¡ CurMenu.style.display = "block"; ¡¡¡¡ //ÑÓʱ2ºÁÃëºóÔÙÏÔʾ²Ëµ¥,±£Ö¤ToolbarMenu.offsetHeightÓÐÖµ,±ÜÃâ´ÓÖ÷²Ëµ¥ÒÆÏòÏÂÀ­²Ëµ¥Ê±ÏÂÀ­²Ëµ¥Ïûʧ. ¡¡¡¡ window.setTimeout("showMenu()", 2); ¡¡¡¡ return true; ¡¡¡¡} ¡¡¡¡function showMenu() ¡¡¡¡{ ¡¡¡¡ y2 = y + TempMenu.offsetHeight; x2 = x + TempMenu.offsetWidth; ¡¡¡¡ TempMenu.style.clip = "rect(auto auto auto auto)"; ¡¡¡¡ IsDroped =true;//ÏÂÀ­²Ëµ¥ÒѾ­ÏÔʾ ¡¡¡¡} ¡¡¡¡function hideMenu() ¡¡¡¡{ //Èç¹ûÔÚÏÂÀ­²Ëµ¥µÄ·¶Î§Ö®ÄÚÒƶ¯Ôò²»Òþ²Ø. ¡¡¡¡ //cY = event.clientY + document.body.scrollTop; cY = event.clientY ¡¡¡¡ if (cY>=y && cY<y2 && event.clientX >= (x+5) && event.clientX <= x2 || ¡¡¡¡ cY>1 && cY<y && event.clientX >= (x+5) && event.clientX <= x2-10 ) ¡¡¡¡ { window.event.cancelBubble = true; return;} ¡¡¡¡ //Òþ²Ø ¡¡¡¡ TempMenu.style.display = "none"; ¡¡¡¡ window.event.cancelBubble = true; ¡¡¡¡ IsDroped =false; ¡¡¡¡} Ê×Ò³ Ñо¿ÊÒ¼ò½é Ñо¿·½Ïò ÈËÔ± ³Ðµ£ÏîÄ¿ ·¢±íÎÄÕ Ñо¿³É¹û ×ÊÔ´ ¹âÈÙ°ñ ÕÐÉúÕÐƸ ¾ãÀÖ²¿ ²©¿Í ÂÛ̳ Á´½Ó ¡¡¡¡ ¡¡¡¡var domainroot="www.insun.hit.edu.cn"//¸öÈËÕ¾µãÓòÃû£¬Ìæ»»³ÉÄãµÄÍøÕ¾µÄÍøÖ·¼´¿É ¡¡¡¡function Gsitesearch(curobj){ ¡¡¡¡curobj.q.value="site:"+domainroot+" "+curobj.qfront.value ¡¡¡¡} ¡¡¡¡ Õ¾ÄÚËÑË÷: ITNLPʵÑéÊÒ½«ÓÚ±¾ÖÜËÄ£¨10ÔÂ19ÈÕ£©ÏÂÎç14:00ÔÚм¼ÊõÂ¥618#¾ÙÐÐѧÊõ»î¶¯£¬»áÉÏÓÉËï³Ð½Ü²©Ê¿ÉúΪ´ó¼Ò×÷±¨¸æ¡£[2006-10-18] ITNLPʵÑéÊÒ½«ÓÚ±¾ÖÜÈý£¨10ÔÂ11ÈÕ£©ÉÏÎç8:30ÔÚм¼ÊõÂ¥618#¾ÙÐÐѧÊõ»î¶¯£¬»áÉÏÓÉФ¾µ»Ô²©Ê¿ÉúΪ´ó¼Ò×÷±¨¸æ¡£[2006-10-10] >>¸ü¶à Ò»ÔÂÄÚ InSunÓï¾ä¼¶ÊÖ»úÖÇÄÜÆ´Òôºº×ÖÊäÈë·¨£¨ÊäÈë·¨ÑÝʾ¡¢Èí¼þÏÂÔؼ°Óû§Êֲᣩ (11182) ×ÔÈ»ÓïÑÔ´¦Àí£ºÑо¿Í³¼ÆÓïÑÔÄ£ÐÍ¡¢ºº×Ö´¦Àí¡¢×Ô¶¯·Ö´Ê¡¢ÃüÃûʵÌåʶ±ð¡¢¾ä·¨·ÖÎö¡¢ÓïÒå·ÖÎö¡¢ÓïÁÏ¿â¶à¼¶¼Ó¹¤µÈ (1798) ÍøÂçÐÅÏ¢´¦Àí£ºÑо¿ÐÂÒ»´ú¾«È·ËÑË÷ÒýÇ棬ÍøÂ簲ȫ¼¼Êõ£¬ÎÊ´ðʽÐÅÏ¢¼ìË÷£¬º£Á¿ÐÅÏ¢µÄ×Ô¶¯·ÖÀ࣬ÍøÂçÍÚ¾ò£¬ÍøÂçÐÅϢѹËõµÈµÈ (1723) Ò»ÄêÄÚ InSunÓï¾ä¼¶ÊÖ»úÖÇÄÜÆ´Òôºº×ÖÊäÈë·¨£¨ÊäÈë·¨ÑÝʾ¡¢Èí¼þÏÂÔؼ°Óû§Êֲᣩ (11182) ÖÇÄܼ¼ÊõÓë×ÔÈ»ÓïÑÔ´¦ÀíÑо¿ÊÒ (4108) ÕÐÉúÕÐƸ (3181) Óû§Ãû£º ÃÜÂ룺 ¸÷À¸Ä¿¸ºÔðÈË ¡¡ ·¢²¼Ê±¼ä µã»÷´ÎÊý ʵÑéÊÒ»ñµÃ2006Äê¶ÈÁ½Ïî¹ú¼Ò×ÔÈ»¿Æѧ»ù½ð×ÊÖú[2006-9-26] 2006-09-26 283 ÈÈÁÒ»¶Ó­¸÷Öصã´óѧµÄÍƼö˶ʿÉúÉ걨ÎÒÑо¿ÊÒ[2006-09-15] 2006-09-15 167 µÚÈý´ÎÎÊ´ðʽÐÅÏ¢¼ìË÷¹¤×÷»áÒé¼ÍÒª[2006-7-17] 2006-07-17 359 ITNLPÑо¿ÊÒ¶­ÆôÎIJ©Ê¿ÉúÈëÑ¡¹þ¶û±õ¹¤Òµ´óѧµÚ°ËÅúÕýÔÚ½øÐеÄÓÅÐ㲩ʿѧλÂÛÎÄÃûµ¥[2006-7-6] 2006-07-07 214 ΢ÈíÑÇÖÞÑо¿ÔºÓë¹þ¶û±õ¹¤Òµ´óѧ½ÌÓý²¿-΢ÈíÓïÑÔÓïÒôÖصãʵÑéÊÒÉîÛÚ·ÖÊÒÁªºÏ¾Ù°ì2006ÄêÐÂÒ»´ú»¥ÁªÍøÐÅÏ¢´¦Àí¼¼ÊõÊîÆÚÑÐÌÖ°à[2006-6-21] 2006-06-21 294 ITNLPÑо¿ÊÒ2005Äê¶ÈÂÛÎļ¯³ö°æ[2006-6-10] 2006-06-10 218 ITNLPʵÑéÊÒÍƳöÊÖ»úƽ̨ÐÂÎÅ·ÖÀàÍÆËÍϵͳ[2006-05-30] 2006-06-20 238 ʵÑéÊÒÈýλÀÏʦ²Î¼ÓµÚÈý½ìÈ«¹ú×ÔÈ»ÓïÑÔ´¦ÀíÇàÄêÑÐÌÖ»á[2006-5-16] 2006-05-16 295 >>¸ü¶à ±êÌâ ËùÔÚÀ¸Ä¿ ¸üÐÂʱ¼ä µã»÷´ÎÊý ·¢±íÂÛÎĵÄÊ®Ìõ½ðÓñÁ¼ÑÔ£¨·­Ò룩 ²©¿Í 2006-10-17 161 ÉúÎïҽҩʵÌåʶ±ðµÄ¹¤×÷¸æÒ»¶ÎÂä ²©¿Í 2006-10-16 79 InSunÓï¾ä¼¶ÊÖ»úÖÇÄÜÆ´Òôºº×ÖÊäÈë·¨£¨ÊäÈë·¨ÑÝʾ¡¢Èí¼þÏÂÔؼ°Óû§Êֲᣩ ³É¹ûÍƹã 2006-10-16 533 ʵÑéÊÒ»ñµÃ2006Äê¶ÈÁ½Ïî¹ú¼Ò×ÔÈ»¿Æѧ»ù½ð×ÊÖú[2006-9-26] ÖÐÎÄÐÂÎÅ 2006-10-06 268 Effect of example weights on prediction of protein¨Cprotein interactions ÂÛÎÄ 2006-09-27 52 ÊÖ»úƽ̨ÐÂÎÅ·ÖÀàÍÆËÍϵͳ ³É¹û 2006-09-26 104 ÈÈÁÒ»¶Ó­¸÷Öصã´óѧµÄÍƼö˶ʿÉúÉ걨ÎÒÑо¿ÊÒ ÂÛ̳ 2006-09-25 103 Combining trigram and automatic weight distribution in Chinese spelling error correction ÂÛÎÄ 2006-09-25 165 A new linguistic decoding method for online handwritten Chinese character recognition ÂÛÎÄ 2006-09-25 86 A HYBRID LANGUAGE MODEL BASED ON STATISTICS AND LINGUISTIC RULES ÂÛÎÄ 2006-09-25 326 ¹þ¶û±õ¹¤Òµ´óѧ ÖÇÄܼ¼ÊõÓë×ÔÈ»ÓïÑÔ´¦ÀíʵÑéÊÒ Óʱà:150001 µç»°:0451-86413322 Copyright 1993-2006. All rights reserved. ------------------------------------------- ------------------PicUrl--------------------- image/wu/zuixingonggao.jpg image/wu/gonggaoitem.jpg image/wu/gonggaoitem.jpg image/wu/redian.jpg image/wu/tubiao.gif image/wu/redianitem.jpg image/wu/redianitem.jpg image/wu/redianitem.jpg image/wu/tubiao.gif image/wu/redianitem.jpg image/wu/redianitem.jpg image/wu/redianitem.jpg image/wu/neibuguanli.jpg image/wu/fangwentongji.jpg image/wu/xinwenitem.jpg image/wu/xinwenitem.jpg image/wu/xinwenitem.jpg image/wu/xinwenitem.jpg image/wu/xinwenitem.jpg image/wu/xinwenitem.jpg image/wu/xinwenitem.jpg image/wu/xinwenitem.jpg image/wu/jingpin2.gif image/wu/jingpin2.gif image/wu/jingpin2.gif image/wu/jingpin2.gif image/wu/jingpin2.gif image/wu/jingpin2.gif image/wu/jingpin2.g image/wu/jingpin2.g image/wu/jingpin2.g image/wu/jingpin2.g ------------------- 输入编码latin1 输出编码ascii 编码ascii
Received on Thursday, 16 November 2006 05:30:50 UTC