English | 中文版 | 手機(jī)版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當(dāng)前位置 > 技術(shù)服務(wù) > 生物研發(fā)服務(wù)> 芯片與生物信息學(xué) > 文本挖掘服務(wù)
文本挖掘服務(wù)

文本挖掘服務(wù)


Text mining services
生物醫(yī)學(xué)文獻(xiàn)中蘊(yùn)藏著各種各樣的生物醫(yī)學(xué)知識,通過借助不同的數(shù)據(jù)挖掘/文獻(xiàn)挖掘方法,文獻(xiàn)挖掘可以選擇性的從中提取出特定主題的知識。作為一個完整的文 獻(xiàn)挖掘平臺,需要完成兩類功能:數(shù)據(jù)處理與文獻(xiàn)挖掘。
服務(wù)類別:芯片與生物信息學(xué)總訪問:757
最后更新:2015-4-2半年訪問:23
參考報價:
立即詢價 電話咨詢
[發(fā)表評論] [本類其他服務(wù)] [本類其他服務(wù)商]
服務(wù)商: 無錫眾信科技有限公司 查看該公司所有服務(wù) >>
  • 服務(wù)介紹
  • 公司簡介
生物醫(yī)學(xué)知識發(fā)現(xiàn)平臺
 
生物醫(yī)學(xué)文獻(xiàn)中蘊(yùn)藏著各種各樣的生物醫(yī)學(xué)知識,通過借助不同的數(shù)據(jù)挖掘/文獻(xiàn)挖掘方法,文獻(xiàn)挖掘可以選擇性的從中提取出特定主題的知識。作為一個完整的文 獻(xiàn)挖掘平臺,需要完成兩類功能:數(shù)據(jù)處理與文獻(xiàn)挖掘。數(shù)據(jù)處理包括文獻(xiàn)數(shù)據(jù)處理和其他數(shù)據(jù)處理,如從文獻(xiàn)數(shù)據(jù)庫中獲取文獻(xiàn)數(shù)據(jù),驗(yàn)證數(shù)據(jù)的完整性,提取文 獻(xiàn)數(shù)據(jù)中的特定信息,以及提取其他類型的數(shù)據(jù)中的指定信息。在數(shù)據(jù)處理系統(tǒng)提供的規(guī)范化數(shù)據(jù)的基礎(chǔ)之上,文獻(xiàn)挖掘系統(tǒng)對其進(jìn)行統(tǒng)計或者NLP方面的分析處 理,進(jìn)而挖掘出實(shí)體名稱、實(shí)體關(guān)聯(lián)模式和實(shí)體關(guān)聯(lián)網(wǎng)絡(luò)等知識。
 
根據(jù)文獻(xiàn)挖掘的處理流程,生物醫(yī)學(xué)知識發(fā)現(xiàn)平臺包括六個子系統(tǒng):1)文獻(xiàn)獲取系統(tǒng),主要功能包括文獻(xiàn)下載、文獻(xiàn)校驗(yàn)、數(shù)據(jù)更新和數(shù)據(jù)日志分析等;2)數(shù)據(jù) 預(yù)處理系統(tǒng),主要功能為從原始數(shù)據(jù)中提取出指定的信息,并按照需求保存為合適的格式;3)NLP系統(tǒng),加工文本數(shù)據(jù),將文本數(shù)據(jù)轉(zhuǎn)換為可以進(jìn)行知識推理的 素材,主要功能為分詞、實(shí)體名稱識別、詞性標(biāo)注和實(shí)體名稱映射等;4)關(guān)系挖掘系統(tǒng),主要功能為計算實(shí)體共出現(xiàn)頻率,提取實(shí)體關(guān)聯(lián)模式,提取關(guān)聯(lián)實(shí) 體;5)網(wǎng)絡(luò)構(gòu)建系統(tǒng),主要功能是提供實(shí)體關(guān)聯(lián)網(wǎng)絡(luò)的基本性質(zhì)以及連通子圖、Hub子圖和關(guān)聯(lián)子網(wǎng)絡(luò)的提;6)網(wǎng)絡(luò)可視化系統(tǒng),圖形化展示網(wǎng)絡(luò)分析結(jié) 果。系統(tǒng)的部分成果發(fā)布在http://lifecenter.sgst.cn/textweb。
 
技術(shù)基礎(chǔ)
生物醫(yī)學(xué)知識發(fā)現(xiàn)平臺是一個JavaEE系統(tǒng),整合了GeniaTagger、Mallet、ABner和Standford Parser等自然語言處理相關(guān)的軟件,能夠完成常見的文本挖掘任務(wù)。由于文本挖掘任務(wù)是高計算量的工作,知識發(fā)現(xiàn)平臺在多線程處理方面進(jìn)行了大量的優(yōu)化 工作。
 
服務(wù)方式
依托知識發(fā)現(xiàn)平臺,我們能夠提高如下的服務(wù):
生物醫(yī)學(xué)文獻(xiàn)注釋與服務(wù):從文獻(xiàn)中識別出實(shí)體,從而實(shí)現(xiàn)文獻(xiàn)注釋的目的,并能夠在傳統(tǒng)的文獻(xiàn)查詢功能基礎(chǔ)之上,提高基于實(shí)體的查詢;
 
特定疾病相關(guān)的文本挖掘:能夠提供疾病及其相關(guān)疾病的信息,以及疾病相關(guān)的基因、蛋白質(zhì)、小分子等信息;
 
多個基因/蛋白質(zhì)的關(guān)聯(lián)網(wǎng)絡(luò)分析:依托全文獻(xiàn)數(shù)據(jù)庫的文本挖掘結(jié)果,構(gòu)建實(shí)體關(guān)聯(lián)網(wǎng)絡(luò),從而能夠從網(wǎng)絡(luò)中找出指定的基因/蛋白質(zhì)之間的關(guān)系,并以網(wǎng)絡(luò)的形式展示這種關(guān)系;
 
生物醫(yī)學(xué)數(shù)據(jù)整合服務(wù):借助實(shí)體關(guān)聯(lián)網(wǎng)絡(luò)和實(shí)體名稱-生物醫(yī)學(xué)數(shù)據(jù)映射技術(shù),我們能夠提供基于文獻(xiàn)的數(shù)據(jù)整合服務(wù);
 
其它文本挖掘定制服務(wù):我們可以依照用戶需求,分析文獻(xiàn)的內(nèi)容,為用戶定制特定的文本挖掘服務(wù)。
bio-equip.com
售后服務(wù)
快速詢價登錄注冊在線詢價 (請留下您的聯(lián)系方式,以便供應(yīng)商聯(lián)系您)
* 姓  名:
* 地  區(qū):
* 單  位:
職  位:
* 手機(jī)/電話:
* E-mail:
請寄產(chǎn)品資料:
需要 不需要
請報價格:
需要報價 不需要報價
留  言:
驗(yàn)證碼:
換一張
發(fā)表評論在線評論(0條)
手機(jī)版:文本挖掘服務(wù)
您最近瀏覽過的服務(wù)
Copyright(C) 1998-2025 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com
立即詢價