展會(huì)信息港展會(huì)大全

神經(jīng)網(wǎng)絡(luò)中文文本文本分類
來源:互聯(lián)網(wǎng)   發(fā)布日期:2011-09-16 11:21:03   瀏覽:23907次  

導(dǎo)讀: 摘要:隨著國際互聯(lián)網(wǎng)的迅猛發(fā)展,網(wǎng)上文本信息資源以指數(shù)級(jí)的速度增長(zhǎng)如何快速有效地將文本按其內(nèi)容進(jìn)行分門別類的整理,以便于利用這些海量文本,變得越來越重要和困難因此,研究文本自動(dòng)分類技術(shù)具有很重要的現(xiàn)實(shí)意義 本文分析考察了文本分類過程中的主要...

摘要:隨著國際互聯(lián)網(wǎng)的迅猛發(fā)展,網(wǎng)上文本信息資源以指數(shù)級(jí)的速度增長(zhǎng)如何快速有效地將文本按其內(nèi)容進(jìn)行分門別類的整理,以便于利用這些海量文本,變得越來越重要和困難因此,研究文本自動(dòng)分類技術(shù)具有很重要的現(xiàn)實(shí)意義 本文分析考察了文本分類過程中的主要技術(shù)中文分詞、特征選擇、粗糙集和分類器構(gòu)造,并在廣泛研究現(xiàn)有文本自動(dòng)分類方法的基礎(chǔ)上,利用人工神經(jīng)網(wǎng)絡(luò)具有的自學(xué)習(xí)性、自組織性、聯(lián)想記憶功能和推理意識(shí)等在文本自動(dòng)分類上的獨(dú)特優(yōu)勢(shì),構(gòu)建了神經(jīng)網(wǎng)絡(luò)分類器由于BPBackProPagation,反向傳播神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于文本自動(dòng)分類領(lǐng)域,因此本文對(duì)BP網(wǎng)絡(luò)文本分類過程分階段進(jìn)行了改進(jìn),并證明了本文方法的優(yōu)越性 本文改進(jìn)了BP神經(jīng)網(wǎng)絡(luò)分類方法,主要設(shè)計(jì)思路如下首先從已有文本中隨機(jī)選擇部分文本,并建立訓(xùn)練語料庫接著對(duì)訓(xùn)練文本進(jìn)行分詞,去掉停用詞和標(biāo)點(diǎn)符號(hào),然后詞頻統(tǒng)計(jì),并生成各文本類的特征向量接著分別使用改進(jìn)互信息、X2統(tǒng)計(jì)方法和本文提出的聯(lián)合特征選擇法,對(duì)特征空間做降維處理然后使用粗糙集理論進(jìn)行屬性約簡(jiǎn)最后建立BP神經(jīng)網(wǎng)絡(luò)文本分類器并初始化網(wǎng)絡(luò),用訓(xùn)練語料庫訓(xùn)練BP文本分類器,直至網(wǎng)絡(luò)的訓(xùn)練滿足一定的收斂條件至此,基于BP神經(jīng)網(wǎng)絡(luò)的文本分類器構(gòu)造完成標(biāo)題:神經(jīng)網(wǎng)絡(luò)中文文本文本分類專業(yè):計(jì)算機(jī)軟件與理論學(xué)位:碩士單位:南京郵電大學(xué)@關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò) 中文文本 文本分類 論文時(shí)間:2008分類:TP391.1 TP183 導(dǎo)師:陳慧南 張衛(wèi)豐 語種:中文文摘URL:

贊助本站

相關(guān)熱詞: 網(wǎng)絡(luò) 中文文 本文本

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港