- From: chendong <dchen@insun.hit.edu.cn>
- Date: Mon, 16 Oct 2006 13:29:36 +0800
- To: html-tidy@w3.org
//============code==================================
#include "tidyenum.h"
#include "tidy.h"
#include "buffio.h"
#include "stdio.h"
#include "errno.h"
#include <iostream>
using namespace std;
void dumpNode( TidyNode tnod, int indent );
void dumpDoc( TidyDoc tdoc );
void dumpBody( TidyDoc tdoc );
void showText( TidyDoc tdoc, TidyNode tnod, TidyBuffer * buf );
void getPicUrl( TidyNode tnode );
int main(int argc, char **argv )
{
const char* input = "f00005";
TidyBuffer output = {0};
TidyBuffer errbuf = {0};
int rc = -1;
Bool ok;
TidyDoc tdoc = tidyCreate(); // Initialize
"document"
printf( "Tidying:\t%s\n", input );
tidySetCharEncoding( tdoc, "ascii" );
ok = tidyOptSetBool( tdoc, TidyXhtmlOut, yes ); // Convert to XHTML
if ( ok )
rc = tidySetErrorBuffer( tdoc, &errbuf ); // Capture diagnostics
if ( rc >= 0 )
rc = tidyParseFile( tdoc, input ); // Parse the input
if ( rc >= 0 )
rc = tidyCleanAndRepair( tdoc ); // Tidy it up!
if ( rc >= 0 )
rc = tidyRunDiagnostics( tdoc ); // Kvetch
if ( rc > 1 ) // If error, force
output.
rc = ( tidyOptSetBool(tdoc, TidyForceOutput, yes) ? rc : -1 );
if ( rc >= 0 )
rc = tidySaveBuffer( tdoc, &output ); // Pretty Print
if ( rc >= 0 )
{
if ( rc > 0 )
printf( "\nDiagnostics:\n\n%s", errbuf.bp );
printf( "\nAnd here is the result:\n\n%s", output.bp );
}
else
printf( "A severe error (%d) occurred.\n", rc );
//--------------------------------------------------
cout<<"------------------text---------------------"<<endl;
TidyBuffer buf = {0};
showText( tdoc, tidyGetRoot(tdoc), &buf );
tidyBufFree( &buf );
cout<<"-------------------------------------------"<<endl;
cout<<"------------------PicUrl---------------------"<<endl;
TidyNode html = tidyGetHtml( tdoc );
getPicUrl( html );
cout<<"-------------------------------------------"<<endl;
//dumpBody( tdoc );
ctmbstr inname = tidyOptGetEncName( tdoc, TidyInCharEncoding );
printf("\n\n\n");
printf( "输入编码%s\n", inname );
ctmbstr outname = tidyOptGetEncName( tdoc, TidyOutCharEncoding );
printf( "输出编码%s\n", outname );
outname = tidyOptGetEncName( tdoc, TidyCharEncoding );
printf( "编码%s\n", outname );
tidyBufFree( &output );
tidyBufFree( &errbuf );
tidyRelease( tdoc );
return rc;
}
void getPicUrl( TidyNode tnode )
{
TidyNode child;
for( child = tidyGetChild( tnode ); child; child = tidyGetNext(child) )
{
TidyAttr attr;
if( tidyNodeIsIMG(child) )
{
attr = tidyAttrGetSRC(child);
cout<<tidyAttrValue(attr)<<endl;
}
getPicUrl( child );
}
}
void showText( TidyDoc tdoc, TidyNode tnod, TidyBuffer * buf )
{
TidyNode child;
for( child = tidyGetChild(tnod); child; child = tidyGetNext(child) )
{
if( tidyNodeIsText( child ) )
{
tidyNodeGetText( tdoc, child, buf );
printf( "\n\n%s\n\n", buf->bp);
tidyBufFree( buf );
}
showText( tdoc, child, buf );
}
}
//===================f00005===paring file========================
<html>
<head>
<title>智能技术与自然语言处理研究室</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta name="keywords" content="自然语言处理,智能技术,问答系统,自动文
摘,智能人机接口,计算分子生物学,生物信息学,NLP,多文档自动文摘、单文档
自动文摘、关键词自动抽取、摘要生成、关键词自动标引,生物信息学,蛋白质二
级结构预测,生物语言模型,蛋白质结构词典,基因区域预测,基因表达数据聚
类,基因调控网络,汉字输入法,语句级智能拼音汉字输入法,手机汉字输入法,
数字键盘汉字输入法,智能人机接口,问答式信息检索、信息检索、信息抽取、文
本分类、文本挖掘、句法分析、命名实体识别、自动分词、词性标注">
<meta name="description" content="哈尔滨工业大学计算机学院智能技术与自然
语言处理研究室(ITNLP)是国内较早从事自然语言处理研究的科研团体之一。研
究室从八十年代初期以来,先后开展了机器翻译、固定段落问答、自动文摘、文本
纠错、汉字智能输入、语音合成、语料库多级加工和语言模型等多项研究。网络信
息处理:研究面向国际互联网海量网络文本的问答式信息检索、多文档自动文摘、
文本分类、网络挖掘等。 智能人机接口:研究智能化汉字输入输出技术,包括
跨平台(台式机、手机类移动设备等)智能化汉字键盘输入、语音识别与合成、手
写体汉字识别后处理等。自然语言处理:研究统计语言模型、汉字处理、自动分
词、命名实体识别、句法分析、语义分析、语料库多级加工等。计算分子生物学:
计算分子生物学是一个十分活跃的研究领域,它致力于应用可计算的技术研究生物
学的问题,包括存储、抽取和分析生物学数据。研究室的代表性成果是开创性地提
出了汉字语句输入的思想并实现国内外第一个语句级汉字输入系统。目前共获得部
科技进步级一等奖1项,二等奖4项,三等奖3项,获得国家专利1项。先后发表论文
200余篇,编著书8部。1990年以来完成和承担的国家自然科学基金项目、国家863
重点项目和面上项目、中美、中日国际合作项目等重要科研项目20多项。其中包
括:与北京四达公司合作的“四达-863A”语音文字系统;具有自主知识产权的Insun
汉字语句输入系统;与美国微软公司合作的"微软拼音"智能汉字输入系统;授权日
本富士通公司使用的智能手机汉字输入技术等等。研究室(包括校本部和深圳研究
部)目前拥有一支由博士生导师、教授、副教授、讲师、博士生、硕士生等近八十
余人组成的研究队伍。已培养工学博士七人,工学硕士三十余人。曾先后与微软公
司、微软亚洲研究院、日本Canotec公司、富士通公司等国际知名大公司的合作研
发项目,与香港、台湾、北美等地区多个高校相关专业研究室建立了合作关系,并
作为微软与哈工大成立的自然语言处理及语音技术联合实验室的一员,与微软亚洲
研究院联合培养博士生。">
<link rel="stylesheet" href="image/myvt-toolbar.css" type="text/css">
<link rel="stylesheet" href="image/virginiatech.css" type="text/css">
<link rel="stylesheet" href="image/VTNews.css" type="text/css">
<style>.n{TEXT-DECORATION:none}</style>
</head>
<body bgcolor="#FFFFFF" text="#000000" leftmargin="0" topmargin="0"
background="image/wu/beijing.jpg">
<table width="900" height="66" border="0" cellspacing="0"
cellpadding="0" align="center" background="image/wu/logo.jpg">
<tr>
<td width="85%"></td>
<td width="15%" align="center" valign="middle">
<table>
<tr height=60%></tr>
<tr height=40%><td><a href="default.asp" target="_parent"><font
face="Arial, Helvetica, sans-serif"
color="#FFFFF">ENGLISH</font></a></td></tr>
</table>
</td>
</tr>
</table>
<SCRIPT LANGUAGE="JavaScript" >
var IsDroped =false;
function mouseout()
{ }
function mouseover()
{ }
function doMenu(MenuID)
{
var CurMenu = document.all(MenuID);
//为避免闪烁,如果下拉菜单已经显示则不重画.
if (IsDroped==true)
{
window.event.cancelBubble = true;
return false;
}
window.event.cancelBubble = true;
TempMenu = CurMenu;
//计算下拉菜单的位置
x = window.event.clientX - window.event.srcElement.offsetWidth ;
y = pad.offsetHeight + 50;
//y=window.event.srcElement.offsetTop
+window.event.srcElement.offsetParent.offsetTop + 70;
CurMenu.style.top = y;
CurMenu.style.left = x;
CurMenu.style.clip = "rect(0 0 0 0)";
CurMenu.style.display = "block";
//延时2毫秒后再显示菜单,保证ToolbarMenu.offsetHeight有值,避免从主菜
单移向下拉菜单时下拉菜单消失.
window.setTimeout("showMenu()", 2);
return true;
}
function showMenu()
{
y2 = y + TempMenu.offsetHeight;
x2 = x + TempMenu.offsetWidth;
TempMenu.style.clip = "rect(auto auto auto auto)";
IsDroped =true;//下拉菜单已经显示
}
function hideMenu()
{
//如果在下拉菜单的范围之内移动则不隐藏.
//cY = event.clientY + document.body.scrollTop;
cY = event.clientY
if (cY>=y && cY<y2 && event.clientX >= (x+5) && event.clientX <= x2
||
cY>1 && cY<y && event.clientX >= (x+5) && event.clientX <= x2-10 )
{ window.event.cancelBubble = true; return;}
//隐藏
TempMenu.style.display = "none";
window.event.cancelBubble = true;
IsDroped =false;
}
</SCRIPT>
<link rel="stylesheet" href="image/virginiatech.css" type="text/css">
<link rel="stylesheet" href="image/myvt-toolbar.css" type="text/css">
<div ID='pad' STYLE='position:relative;' align="center" width="900">
<table cellspacing=0 cellpadding=0 width="900" border=0 align="center"
height="43" background="image/wu/bar_bg.jpg">
<tr align="center">
<td class=categorynavigation width="78"><a
href="default_cn.asp" target="_parent">首
页</a></td>
<td class=categorynavigation width="86"><a
href="news/view_cn.asp?id=192" target="_parent"
>研究室简介</a></td>
<td class=categorynavigation width="74"><a
href="news/default_cn.asp?cataid=30"
target="_parent">研究方向</a></td>
<td class=categorynavigation width="38"><a
href="news/default1_cn.asp" target="_parent">人
员</a></td>
<td class=categorynavigation width="74"><a
href="news/displayproject.asp"
target="_parent">承担项目</a></td>
<td class=categorynavigation width="74"><a
href="reportsearch.asp" target="_parent">发表文
章</a></td>
<td class=categorynavigation width="76"><a
href="product/product_cn.asp"
target="_parent">研究成果</a></td>
<td class=categorynavigation width="40"><a
href="news/download_cn.asp" target="_parent"> 资
源</a></td>
<td class=categorynavigation width="56"><a
href="news/default_cn.asp?cataid=66"
target="_parent">光荣榜</a></td>
<td class=categorynavigation width="76"><a
href="news/view_cn.asp?id=201"
target="_parent">招生招聘</a></td>
<td class=categorynavigation width="56"><a
href="club/index_1.asp" target="new">俱乐
部</a></td>
<td class=categorynavigation width="40"><a
href="oblog3/index.asp" target="_blank">博
客</a></td>
<td class=categorynavigation width="40"><a
href="bbs/default.asp" target="_blank"
ID='pad3'>论坛</a></td>
<td class=categorynavigation width="90"><a
href="news/view_cn.asp?id=467"
target="_parent">链接</a></td>
</tr>
</table>
</div>
<table border="0" width="900" cellspacing="0" cellpadding="0"
align="center" height=650>
<tr>
<td valign="top" width=330 >
<!-- 左边栏目开始 -->
<table cellspacing=0 cellpadding=0 width="100%" border=0" >
<tr >
<td>
<script type="text/javascript">
var domainroot="www.insun.hit.edu.cn"//个人站点域名,替换成你的网站
的网址即可
function Gsitesearch(curobj){
curobj.q.value="site:"+domainroot+" "+curobj.qfront.value
}
</script>
<table cellspacing=0 cellpadding=0 width="90%" border=0 height="20"
align="left">
<form action="http://www.Google.com/search" method="get"
onSubmit="Gsitesearch(this)" target=new>
<input name="q" type="hidden" />
<tr>
<td height=20 class="redian" width="25%" ><font face="Arial,
Helvetica, sans-serif" color="#000000">站内搜索:</font></td>
<td align="left" width="70%"><input name="qfront" type="text"
STYLE='width:190px' > </td>
<td align="left" width="5%"><input type="submit" value="搜索"
target=new> </td>
</tr>
</form>
</table></td>
</tr>
<tr>
<td height="100" >
<!-- 最新公告 -->
<table cellspacing=0 cellpadding=0 width="100%" border=0
height="100" >
<tr>
<td align="left" height="40" valign="bottom">
<img width=320 height=24 src="image/wu/zuixingonggao.jpg"
border=0>
</td>
</tr>
<tr>
<td>
<table cellspacing=0 cellpadding=0 width="96%"
border=0>
<tr height="25">
<td class="MenuItems">
<img src="image/wu/gonggaoitem.jpg"
border=0>
<a href="news/view_cn.asp?id=567"
target="_blank" class=n>ITNLP实验室将于本周四(10月19日)下午14:00在新技
术楼618#举行学术活动,会上由孙承杰博士生为大家作报告。[2006-10-18]</a>
</td>
</tr>
<tr height="25">
<td class="MenuItems">
<img src="image/wu/gonggaoitem.jpg"
border=0>
<a href="news/view_cn.asp?id=559"
target="_blank" class=n>ITNLP实验室将于本周三(10月11日)上午8:30在新技
术楼618#举行学术活动,会上由肖镜辉博士生为大家作报告。[2006-10-10]</a>
</td>
</tr>
<tr>
<td height="20" class="redian">
<div align=right><a
href="news/default_cn.asp?cataid=56" target="_blank">
>>更多
</a></div>
</td>
</tr>
</table>
</td>
</tr>
</table>
<!-- 最新公告结束 -->
</td>
</tr>
<tr>
<td>
<!-- 热点 -->
<table cellspacing=0 cellpadding=0 width="100%" border=0>
<tr>
<td align="left"><img width=320 height=24
src="image/wu/redian.jpg" border=0></td>
</tr>
<tr>
<td>
<!-- 本月热点 -->
<table cellspacing=0 cellpadding=0 width="96%"
border=0>
<tr>
<td height="30" align="left" class=redian><img
src="image/wu/tubiao.gif" border=0> 一月内</td>
</tr>
<tr height="25">
<td width="95%" class="redian">
<img src="image/wu/redianitem.jpg"
border=0>
<a href="news/view_cn.asp?id=297"
target="_blank" class=n>InSun语句级手机智能拼音汉字输入法(输入法演示、
软件下载及用户手册)</a>(11182)
</td>
</tr>
<tr height="25">
<td width="95%" class="redian">
<img src="image/wu/redianitem.jpg"
border=0>
<a href="news/view_cn.asp?id=530"
target="_blank" class=n>自然语言处理:研究统计语言模型、汉字处理、自动分
词、命名实体识别、句法分析、语义分析、语料库多级加工等</a>(1798)
</td>
</tr>
<tr height="25">
<td width="95%" class="redian">
<img src="image/wu/redianitem.jpg"
border=0>
<a href="news/view_cn.asp?id=533"
target="_blank" class=n>网络信息处理:研究新一代精确搜索引擎,网络安全技
术,问答式信息检索,海量信息的自动分类,网络挖掘,网络信息压缩等
等</a>(1723)
</td>
</tr>
</table>
</td>
</tr>
<tr>
<td>
<!-- 年度热点 -->
<table cellspacing=0 cellpadding=0 width="96%"
border=0>
<tr>
<td height="30" align="left" class=redian><img
src="image/wu/tubiao.gif" border=0> 一年内</td>
</tr>
<tr height="25">
<td width="95%" class="redian">
<img src="image/wu/redianitem.jpg"
border=0>
<a href="news/view_cn.asp?id=297"
target="_blank" class=n>InSun语句级手机智能拼音汉字输入法(输入法演示、
软件下载及用户手册)</a>(11182)
</td>
</tr>
<tr height="25">
<td width="95%" class="redian">
<img src="image/wu/redianitem.jpg"
border=0>
<a href="news/view_cn.asp?id=192"
target="_blank" class=n>智能技术与自然语言处理研究室</a>(4108)
</td>
</tr>
<tr height="25">
<td width="95%" class="redian">
<img src="image/wu/redianitem.jpg"
border=0>
<a href="news/view_cn.asp?id=201"
target="_blank" class=n>招生招聘</a>(3181)
</td>
</tr>
</table>
</td>
</tr>
</table>
<!-- 热点结束 -->
</td>
</tr>
<tr>
<td>
<!-- 内部管理 -->
<form name="form2" method="post" action="mana/login.asp"
target="new">
<table cellspacing=0 cellpadding=0 width="100%" border=0>
<tr>
<td colspan=4 height=10> </td>
</tr>
<tr>
<td height=30 colspan=4>
<img width=320 height=24
src="image/wu/neibuguanli.jpg">
</td>
</tr>
<tr>
<td width="20%" height=25" class="redian"><font
face="Arial, Helvetica, sans-serif"> 用户名:</font></td>
<td width="30%" height=25
align=left>
<input style="BORDER-RIGHT: #ffffff 1px
groove; BORDER-TOP: #ffffff 1px groove; FONT: 12px
Verdana,Geneva,sans-serif; BORDER-LEFT: #ffffff 1px groove; WIDTH: 90px;
COLOR: #000000; BORDER-BOTTOM: #ffffff 1px groove; HEIGHT: 18px;
BACKGROUND-COLOR: #e6f3ff" size=15 name=user>
</td>
<td width="20%" height=25 class="redian"><font
face="Arial, Helvetica, sans-serif"> 密码:</font></td>
<td width="30%" height=25 align=left>
<input style="BORDER-RIGHT: #ffffff 1px
groove; BORDER-TOP: #ffffff 1px groove; FONT: 12px
Verdana,Geneva,sans-serif; BORDER-LEFT: #ffffff 1px groove; WIDTH: 90px;
COLOR: #000000; BORDER-BOTTOM: #ffffff 1px groove; HEIGHT: 18px;
BACKGROUND-COLOR: #e6f3ff" type=password size=10 name=password>
</td>
</tr>
<tr>
<td colspan="4" height=25 align="center">
<input type="submit" name="login" value="登
录" style="background-color: DCDCD4; font-size: 9pt; height: 18; width:
50; border: 1px solid #333333">
<input type="reset" name="register"
value="重设" onClick="Register()" style="background-color: DCDCD4;
font-size: 9pt; height: 18; width: 50; border: 1px solid #333333">
</td>
</tr>
</table>
</form>
<!-- 内部管理结束 -->
</td>
</tr>
<tr>
<td>
<!-- 访问统计 -->
<table cellspacing=0 cellpadding=0 width="100%"
border=0>
<tr>
<td height="40" valign="bottom"><img width=320
height=24 src="image/wu/fangwentongji.jpg"></td>
</tr>
<tr>
<td height="40" valign="bottom" class="redian">
<div align="left" >
<script
src="count/count_cn.asp?style=2"></script>
</div>
</td>
</tr>
</table>
<!-- 访问统计结束 -->
<!-- 访问统计 -->
<table cellspacing=0 cellpadding=0 width="100%"
border=0>
<tr>
<td height="20" valign="bottom" class="redian">
<div align="left" >
<a href="news/banzhulist.asp">各栏目负责
人</a>
</div>
</td>
</tr>
</table>
<!-- 访问统计结束 -->
</td>
</tr>
</table>
<!-- 左边栏目结束 -->
</td>
<td valign="top" width=570 align="right">
<!-- 最新动态 -->
<table cellspacing=0 cellpadding=0 border=0 >
<tr>
<td align=left height="10" class=redian colspan=4> </td>
</tr>
<tr>
<td colspan=4 class=redian
background="image/wu/xinwenzhongxin.jpg" width=553 height=24>
<div align=right>发布时间
点击次数</div>
</td>
</tr>
</table>
<table width="95%" border="0" cellspacing="0" cellpadding="0"
align="center">
<tr>
<td>
<table cellspacing=0 cellpadding=0 width="96%"
border=0 align="right">
<!-- 置顶部分 -->
<tr height="30">
<td width="5%" align="center"><img
src="image/wu/xinwenitem.jpg" border=0> </td>
<td width="70%" class="MenuItems"><a
href="news/view_cn.asp?id=538" target="_parent" class=n>实验室获得2006年
度两项国家自然科学基金资助[2006-9-26]</a></td>
<td width="15%" align="right"
class="redian">2006-09-26</td>
<td width="10%" align="right"
class="redian">283</td>
</tr>
<tr height="30">
<td width="5%" align="center"><img
src="image/wu/xinwenitem.jpg" border=0> </td>
<td width="70%" class="MenuItems"><a
href="news/view_cn.asp?id=535" target="_parent" class=n>热烈欢迎各重点大
学的推荐硕士生申报我研究室[2006-09-15]</a></td>
<td width="15%" align="right"
class="redian">2006-09-15</td>
<td width="10%" align="right"
class="redian">167</td>
</tr>
<tr height="30">
<td width="5%" align="center"><img
src="image/wu/xinwenitem.jpg" border=0> </td>
<td width="70%" class="MenuItems"><a
href="news/view_cn.asp?id=465" target="_parent" class=n>第三次问答式信息
检索工作会议纪要[2006-7-17]</a></td>
<td width="15%" align="right"
class="redian">2006-07-17</td>
<td width="10%" align="right"
class="redian">359</td>
</tr>
<tr height="30">
<td width="5%" align="center"><img
src="image/wu/xinwenitem.jpg" border=0> </td>
<td width="70%" class="MenuItems"><a
href="news/view_cn.asp?id=463" target="_parent" class=n>ITNLP研究室董启
文博士生入选哈尔滨工业大学第八批正在进行的优秀博士学位论文名
单[2006-7-6]</a></td>
<td width="15%" align="right"
class="redian">2006-07-07</td>
<td width="10%" align="right"
class="redian">214</td>
</tr>
<tr height="30">
<td width="5%" align="center"><img
src="image/wu/xinwenitem.jpg" border=0> </td>
<td width="70%" class="MenuItems"><a
href="news/view_cn.asp?id=462" target="_parent" class=n>微软亚洲研究院与
哈尔滨工业大学教育部-微软语言语音重点实验室深圳分室联合举办2006年新一代
互联网信息处理技术暑期研讨班[2006-6-21]</a></td>
<td width="15%" align="right"
class="redian">2006-06-21</td>
<td width="10%" align="right"
class="redian">294</td>
</tr>
<tr height="30">
<td width="5%" align="center"><img
src="image/wu/xinwenitem.jpg" border=0> </td>
<td width="70%" class="MenuItems"><a
href="news/view_cn.asp?id=459" target="_parent" class=n>ITNLP研究室2005
年度论文集出版[2006-6-10]</a></td>
<td width="15%" align="right"
class="redian">2006-06-10</td>
<td width="10%" align="right"
class="redian">218</td>
</tr>
<tr height="30">
<td width="5%" align="center"><img
src="image/wu/xinwenitem.jpg" border=0> </td>
<td width="70%" class="MenuItems"><a
href="news/view_cn.asp?id=458" target="_parent" class=n>ITNLP实验室推出
手机平台新闻分类推送系统[2006-05-30]</a></td>
<td width="15%" align="right"
class="redian">2006-06-20</td>
<td width="10%" align="right"
class="redian">238</td>
</tr>
<tr height="30">
<td width="5%" align="center"><img
src="image/wu/xinwenitem.jpg" border=0> </td>
<td width="70%" class="MenuItems"><a
href="news/view_cn.asp?id=455" target="_parent" class=n>实验室三位老师参
加第三届全国自然语言处理青年研讨会[2006-5-16]</a></td>
<td width="15%" align="right"
class="redian">2006-05-16</td>
<td width="10%" align="right"
class="redian">295</td>
</tr>
<!-- 非置顶部分 -->
<tr height="30">
<td height="22" class="redian" colspan=4>
<div align=right><a
href="news/default_cn.asp?cataid=31">
>>更多
</a></div>
</td>
</tr>
</table>
</td>
</tr>
</table>
<!-- 最新动态结束 -->
<!-- 精品荟萃 -->
<table cellspacing=0 cellpadding=0 border=0 >
<tr>
<td class=redian background="image/wu/jingpinhuicui.jpg"
width=553 height=24>
</td>
</tr>
</table>
<!-- 提取网站数据 -->
<!-- 提取博客数据 -->
<!-- 提取论坛数据 -->
<table width="95%" border="0" cellspacing="0" cellpadding="0"
align="right">
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%" class="redian"
align="center"> </td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="60%"
align=center>标题</td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="10%"
align=center>所在栏目</td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="15%"
align=center>更新时间</td>
<td style="border:1px #D5E9F7 dashed" class="redian" align=right>点
击次数</td>
</tr>
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%"
align="center"><img src="image/wu/jingpin2.gif" border=0></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a
href="oblog3/user1/2/archives/2006/302.html" target="_blank">发表论文的
十条金玉良言(翻译)</a></td>
<td style="border:1px #D5E9F7 dashed" class="redian"
width="10%" align=center>博客</td>
<td style="border:1px #D5E9F7 dashed" class="redian"
width="15%" align=center>2006-10-17</td>
<td class="redian" align=right >161</td>
</tr>
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%"
align="center"><img src="image/wu/jingpin2.gif" border=0></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a
href="oblog3/user1/3/archives/2006/345.html" target="_blank">生物医药实
体识别的工作告一段落</a></td>
<td style="border:1px #D5E9F7 dashed" class="redian"
width="10%" align=center>博客</td>
<td style="border:1px #D5E9F7 dashed" class="redian"
width="15%" align=center>2006-10-16</td>
<td class="redian" align=right >79</td>
</tr>
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%"
align="center"><img src="image/wu/jingpin2.gif" border=0></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a
href="news/view_cn.asp?id=297" target="_blank">InSun语句级手机智能拼音汉
字输入法(输入法演示、软件下载及用户手册)</a></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="10%"
align=center>成果推广</td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="15%"
align=center>2006-10-16</td>
<td style="border:1px #D5E9F7 dashed" class="redian"
align=right>533</td>
</tr>
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%"
align="center"><img src="image/wu/jingpin2.gif" border=0></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a
href="news/view_cn.asp?id=538" target="_blank">实验室获得2006年度两项国
家自然科学基金资助[2006-9-26]</a></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="10%"
align=center>中文新闻</td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="15%"
align=center>2006-10-06</td>
<td style="border:1px #D5E9F7 dashed" class="redian"
align=right>268</td>
</tr>
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%"
align="center"><img src="image/wu/jingpin2.gif" border=0></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a
href="news/viewpublication_cn.asp?id=565" target="_blank">Effect of
example weights on prediction of protein�protein interactions</a></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="10%"
align=center>论文</td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="15%"
align=center>2006-09-27</td>
<td style="border:1px #D5E9F7 dashed" class="redian"
align=right>52</td>
</tr>
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%"
align="center"><img src="image/wu/jingpin2.gif" border=0></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a
href="product/viewproduct.asp?id=156" target="_blank">手机平台新闻分类推
送系统</a></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="10%"
align=center>成果</td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="15%"
align=center>2006-09-26</td>
<td style="border:1px #D5E9F7 dashed" class="redian"
align=right>104</td>
</tr>
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%"
align="center"><img src="image/wu/jingpin2.gif" border=0></td>
<td style="border:1px #D5E9F7 dashed" class="redian"
width="60%"><a href=bbs/bbs/checkasp.asp?id=35 target="_blank">热烈欢迎
各重点大学的推荐硕士生申报我研究室</a></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="10%"
align=center>论坛</td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="15%"
align=center>2006-09-25</td>
<td style="border:1px #D5E9F7 dashed" class="redian"
align=right>103</td>
</tr>
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%"
align="center"><img src="image/wu/jingpin2.gif" border=0></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a
href="news/viewpublication_cn.asp?id=382" target="_blank">Combining
trigram and automatic weight distribution in Chinese spelling error
correction</a></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="10%"
align=center>论文</td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="15%"
align=center>2006-09-25</td>
<td style="border:1px #D5E9F7 dashed" class="redian"
align=right>165</td>
</tr>
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%"
align="center"><img src="image/wu/jingpin2.gif" border=0></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a
href="news/viewpublication_cn.asp?id=394" target="_blank">A new
linguistic decoding method for online handwritten Chinese character
recognition</a></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="10%"
align=center>论文</td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="15%"
align=center>2006-09-25</td>
<td style="border:1px #D5E9F7 dashed" class="redian"
align=right>86</td>
</tr>
<tr height="30">
<td style="border:1px #D5E9F7 dashed" width="5%"
align="center"><img src="image/wu/jingpin2.gif" border=0></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="60%"><a
href="news/viewpublication_cn.asp?id=423" target="_blank">A HYBRID
LANGUAGE MODEL BASED ON STATISTICS AND LINGUISTIC RULES</a></td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="10%"
align=center>论文</td>
<td style="border:1px #D5E9F7 dashed" class="redian" width="15%"
align=center>2006-09-25</td>
<td style="border:1px #D5E9F7 dashed" class="redian"
align=right>326</td>
</tr>
</table>
<!-- 精品荟萃结束 -->
</td>
</tr>
</table>
<table cellspacing=0 cellpadding=0 width=900 height=80 border=0
align="center" background="image/wu/bottom.jpg">
<tbody>
<tr>
<td height="10"></td>
</tr>
<tr>
<td class=footer valign=middle align=left height="60">
<div align="center" class=MenuItems> <font color="#000000">哈尔滨
工业大学 智能技术与自然语言处理实验室<br>
邮编:150001 电话:0451-86413322 <br>
<!-- #BeginLibraryItem "/Library/Copyright.lbi" -->
Copyright 1993-2006. All rights reserved.<!-- #EndLibraryItem
--></font>
<br>
</div>
</td>
</tr>
<tr>
<td height="10"></td>
</tr>
</tbody>
</table>
</body>
</html>
========================paring result===================================
------------------text---------------------
ÖÇÄܼ¼ÊõÓë×ÔÈ»ÓïÑÔ´¦ÀíÑо¿ÊÒ
.n{TEXT-DECORATION:none}
ENGLISH
¡¡¡¡var IsDroped =false;
¡¡¡¡function mouseout()
¡¡¡¡{ ¡¡ }
¡¡¡¡function mouseover()
¡¡¡¡{ ¡¡}
¡¡¡¡function doMenu(MenuID)
¡¡¡¡{
¡¡¡¡ var CurMenu = document.all(MenuID);
¡¡¡¡
//Ϊ±ÜÃâÉÁ˸,Èç¹ûÏÂÀ­²Ëµ¥ÒѾ­ÏÔʾÔò²»ÖØ»­.
¡¡¡¡ if (IsDroped==true)
¡¡¡¡ {
¡¡¡¡ window.event.cancelBubble = true;
¡¡¡¡ return false;
¡¡¡¡ }
¡¡¡¡ window.event.cancelBubble = true;
¡¡¡¡ TempMenu = CurMenu;
¡¡¡¡
//¼ÆËãÏÂÀ­²Ëµ¥µÄλÖÃ
¡¡¡¡ x = window.event.clientX -
window.event.srcElement.offsetWidth ;
¡¡¡¡ y = pad.offsetHeight + 50;
//y=window.event.srcElement.offsetTop
+window.event.srcElement.offsetParent.offsetTop
+ 70;
¡¡¡¡ CurMenu.style.top = y;
¡¡¡¡ CurMenu.style.left = x;
¡¡¡¡ CurMenu.style.clip = "rect(0 0 0 0)";
¡¡¡¡ CurMenu.style.display = "block";
¡¡¡¡
//ÑÓʱ2ºÁÃëºóÔÙÏÔʾ²Ëµ¥,±£Ö¤ToolbarMenu.offsetHeightÓÐÖµ,±ÜÃâ´ÓÖ÷²Ëµ¥ÒÆÏòÏÂÀ­²Ëµ¥Ê±ÏÂÀ­²Ëµ¥Ïûʧ.
¡¡¡¡ window.setTimeout("showMenu()", 2);
¡¡¡¡ return true;
¡¡¡¡}
¡¡¡¡function showMenu()
¡¡¡¡{
¡¡¡¡ y2 = y + TempMenu.offsetHeight;
x2 = x + TempMenu.offsetWidth;
¡¡¡¡ TempMenu.style.clip = "rect(auto auto auto
auto)";
¡¡¡¡ IsDroped
=true;//ÏÂÀ­²Ëµ¥ÒѾ­ÏÔʾ
¡¡¡¡}
¡¡¡¡function hideMenu()
¡¡¡¡{
//Èç¹ûÔÚÏÂÀ­²Ëµ¥µÄ·¶Î§Ö®ÄÚÒÆ¶¯Ôò²»Òþ²Ø.
¡¡¡¡ //cY = event.clientY +
document.body.scrollTop;
cY = event.clientY
¡¡¡¡ if (cY>=y && cY<y2
&& event.clientX >= (x+5) && event.clientX <=
x2 ||
¡¡¡¡ cY>1 && cY<y &&
event.clientX >= (x+5) && event.clientX <= x2-10 )
¡¡¡¡ { window.event.cancelBubble = true;
return;}
¡¡¡¡ //Òþ²Ø
¡¡¡¡ TempMenu.style.display = "none";
¡¡¡¡ window.event.cancelBubble = true;
¡¡¡¡ IsDroped =false;
¡¡¡¡}
Ê×Ò³
Ñо¿ÊÒ¼ò½é
Ñо¿·½Ïò
ÈËÔ±
³Ðµ£ÏîÄ¿
·¢±íÎÄÕÂ
Ñо¿³É¹û
×ÊÔ´
¹âÈÙ°ñ
ÕÐÉúÕÐÆ¸
¾ãÀÖ²¿
²©¿Í
ÂÛ̳
Á´½Ó
¡¡¡¡
¡¡¡¡var
domainroot="www.insun.hit.edu.cn"//¸öÈËÕ¾µãÓòÃû£¬Ìæ»»³ÉÄãµÄÍøÕ¾µÄÍøÖ·¼´¿É
¡¡¡¡function Gsitesearch(curobj){
¡¡¡¡curobj.q.value="site:"+domainroot+"
"+curobj.qfront.value
¡¡¡¡}
¡¡¡¡
Õ¾ÄÚËÑË÷:
ITNLPʵÑéÊÒ½«ÓÚ±¾ÖÜËÄ£¨10ÔÂ19ÈÕ£©ÏÂÎç14:00ÔÚм¼ÊõÂ¥618#¾ÙÐÐѧÊõ»î¶¯£¬»áÉÏÓÉËï³Ð½Ü²©Ê¿ÉúΪ´ó¼Ò×÷±¨¸æ¡£[2006-10-18]
ITNLPʵÑéÊÒ½«ÓÚ±¾ÖÜÈý£¨10ÔÂ11ÈÕ£©ÉÏÎç8:30ÔÚм¼ÊõÂ¥618#¾ÙÐÐѧÊõ»î¶¯£¬»áÉÏÓÉФ¾µ»Ô²©Ê¿ÉúΪ´ó¼Ò×÷±¨¸æ¡£[2006-10-10]
>>¸ü¶à
Ò»ÔÂÄÚ
InSunÓï¾ä¼¶ÊÖ»úÖÇÄÜÆ´Òôºº×ÖÊäÈë·¨£¨ÊäÈë·¨ÑÝʾ¡¢Èí¼þÏÂÔØ¼°Óû§Êֲᣩ
(11182)
×ÔÈ»ÓïÑÔ´¦Àí£ºÑо¿Í³¼ÆÓïÑÔÄ£ÐÍ¡¢ºº×Ö´¦Àí¡¢×Ô¶¯·Ö´Ê¡¢ÃüÃûʵÌåʶ±ð¡¢¾ä·¨·ÖÎö¡¢ÓïÒå·ÖÎö¡¢ÓïÁÏ¿â¶à¼¶¼Ó¹¤µÈ
(1798)
ÍøÂçÐÅÏ¢´¦Àí£ºÑо¿ÐÂÒ»´ú¾«È·ËÑË÷ÒýÇæ£¬ÍøÂ簲ȫ¼¼Êõ£¬ÎÊ´ðʽÐÅÏ¢¼ìË÷£¬º£Á¿ÐÅÏ¢µÄ×Ô¶¯·ÖÀà£¬ÍøÂçÍÚ¾ò£¬ÍøÂçÐÅϢѹËõµÈµÈ
(1723)
Ò»ÄêÄÚ
InSunÓï¾ä¼¶ÊÖ»úÖÇÄÜÆ´Òôºº×ÖÊäÈë·¨£¨ÊäÈë·¨ÑÝʾ¡¢Èí¼þÏÂÔØ¼°Óû§Êֲᣩ
(11182)
ÖÇÄܼ¼ÊõÓë×ÔÈ»ÓïÑÔ´¦ÀíÑо¿ÊÒ
(4108)
ÕÐÉúÕÐÆ¸
(3181)
Óû§Ãû£º
ÃÜÂ룺
¸÷À¸Ä¿¸ºÔðÈË
¡¡
·¢²¼Ê±¼ä µã»÷´ÎÊý
ʵÑéÊÒ»ñµÃ2006Äê¶ÈÁ½Ïî¹ú¼Ò×ÔÈ»¿ÆÑ§»ù½ð×ÊÖú[2006-9-26]
2006-09-26
283
ÈÈÁÒ»¶Ó­¸÷ÖØµã´óѧµÄÍÆ¼ö˶ʿÉúÉ걨ÎÒÑо¿ÊÒ[2006-09-15]
2006-09-15
167
µÚÈý´ÎÎÊ´ðʽÐÅÏ¢¼ìË÷¹¤×÷»áÒé¼ÍÒª[2006-7-17]
2006-07-17
359
ITNLPÑо¿ÊÒ¶­ÆôÎIJ©Ê¿ÉúÈëÑ¡¹þ¶û±õ¹¤Òµ´óѧµÚ°ËÅúÕýÔÚ½øÐеÄÓÅÐ㲩ʿѧλÂÛÎÄÃûµ¥[2006-7-6]
2006-07-07
214
΢ÈíÑÇÖÞÑо¿ÔºÓë¹þ¶û±õ¹¤Òµ´óѧ½ÌÓý²¿-΢ÈíÓïÑÔÓïÒôÖØµãʵÑéÊÒÉîÛÚ·ÖÊÒÁªºÏ¾Ù°ì2006ÄêÐÂÒ»´ú»¥ÁªÍøÐÅÏ¢´¦Àí¼¼ÊõÊîÆÚÑÐÌÖ°à[2006-6-21]
2006-06-21
294
ITNLPÑо¿ÊÒ2005Äê¶ÈÂÛÎö°æ[2006-6-10]
2006-06-10
218
ITNLPʵÑéÊÒÍÆ³öÊÖ»úƽ̨ÐÂÎÅ·ÖÀàÍÆËÍϵͳ[2006-05-30]
2006-06-20
238
ʵÑéÊÒÈýλÀÏʦ²Î¼ÓµÚÈý½ìÈ«¹ú×ÔÈ»ÓïÑÔ´¦ÀíÇàÄêÑÐÌÖ»á[2006-5-16]
2006-05-16
295
>>¸ü¶à
±êÌâ
ËùÔÚÀ¸Ä¿
¸üÐÂʱ¼ä
µã»÷´ÎÊý
·¢±íÂÛÎĵÄÊ®Ìõ½ðÓñÁ¼ÑÔ£¨·­Ò룩
²©¿Í
2006-10-17
161
ÉúÎïҽҩʵÌåʶ±ðµÄ¹¤×÷¸æÒ»¶ÎÂä
²©¿Í
2006-10-16
79
InSunÓï¾ä¼¶ÊÖ»úÖÇÄÜÆ´Òôºº×ÖÊäÈë·¨£¨ÊäÈë·¨ÑÝʾ¡¢Èí¼þÏÂÔØ¼°Óû§Êֲᣩ
³É¹ûÍÆ¹ã
2006-10-16
533
ʵÑéÊÒ»ñµÃ2006Äê¶ÈÁ½Ïî¹ú¼Ò×ÔÈ»¿ÆÑ§»ù½ð×ÊÖú[2006-9-26]
ÖÐÎÄÐÂÎÅ
2006-10-06
268
Effect of example weights on prediction of protein¨Cprotein
interactions
ÂÛÎÄ
2006-09-27
52
ÊÖ»úƽ̨ÐÂÎÅ·ÖÀàÍÆËÍϵͳ
³É¹û
2006-09-26
104
ÈÈÁÒ»¶Ó­¸÷ÖØµã´óѧµÄÍÆ¼ö˶ʿÉúÉ걨ÎÒÑо¿ÊÒ
ÂÛ̳
2006-09-25
103
Combining trigram and automatic weight distribution in Chinese
spelling error correction
ÂÛÎÄ
2006-09-25
165
A new linguistic decoding method for online handwritten Chinese
character recognition
ÂÛÎÄ
2006-09-25
86
A HYBRID LANGUAGE MODEL BASED ON STATISTICS AND LINGUISTIC RULES
ÂÛÎÄ
2006-09-25
326
¹þ¶û±õ¹¤Òµ´óѧ
ÖÇÄܼ¼ÊõÓë×ÔÈ»ÓïÑÔ´¦ÀíʵÑéÊÒ
Óʱà:150001
µç»°:0451-86413322
Copyright 1993-2006. All rights reserved.
-------------------------------------------
------------------PicUrl---------------------
image/wu/zuixingonggao.jpg
image/wu/gonggaoitem.jpg
image/wu/gonggaoitem.jpg
image/wu/redian.jpg
image/wu/tubiao.gif
image/wu/redianitem.jpg
image/wu/redianitem.jpg
image/wu/redianitem.jpg
image/wu/tubiao.gif
image/wu/redianitem.jpg
image/wu/redianitem.jpg
image/wu/redianitem.jpg
image/wu/neibuguanli.jpg
image/wu/fangwentongji.jpg
image/wu/xinwenitem.jpg
image/wu/xinwenitem.jpg
image/wu/xinwenitem.jpg
image/wu/xinwenitem.jpg
image/wu/xinwenitem.jpg
image/wu/xinwenitem.jpg
image/wu/xinwenitem.jpg
image/wu/xinwenitem.jpg
image/wu/jingpin2.gif
image/wu/jingpin2.gif
image/wu/jingpin2.gif
image/wu/jingpin2.gif
image/wu/jingpin2.gif
image/wu/jingpin2.gif
image/wu/jingpin2.g
image/wu/jingpin2.g
image/wu/jingpin2.g
image/wu/jingpin2.g
-------------------
输入编码latin1
输出编码ascii
编码ascii
Received on Thursday, 16 November 2006 05:30:50 UTC