線上訂房服務-台灣趴趴狗聯合訂房中心
發文 回覆 瀏覽次數:1458
推到 Plurk!
推到 Facebook!

斷詞系統

答題得分者是:hipig
leo7w076sc
一般會員


發表:6
回覆:7
積分:2
註冊:2010-08-10

發送簡訊給我
#1 引用回覆 回覆 發表時間:2012-11-13 22:36:32 IP:220.135.xxx.xxx 訂閱
我想請問我該如何組合出所有可能的句子
目前如果我輸入:今天天氣好
已經可以從字面上輸出有意義的詞彙
例如:
今,今天,天,天氣,好

然後再生出有可能的句子:
1.今 天 天氣 好
2.今天 天氣 好

的兩種可能性組合

我該如何做比較好?
目前我已知道可以用動態規劃達成我要的目標,但是對於動態規劃不熟
所以想請問一下各位!
編輯記錄
taishyang 重新編輯於 2012-11-13 18:36:16, 註解 歸類成[問題]‧
hipig
高階會員


發表:29
回覆:75
積分:110
註冊:2007-01-15

發送簡訊給我
#2 引用回覆 回覆 發表時間:2012-11-26 16:57:41 IP:122.116.xxx.xxx 未訂閱
如果沒有資料庫(如人類的大腦)的情況下是不可能達成的
而就算有單機資料庫,字詞分析的好壞取決於資料庫建立的完整性
原理部份這邊不寫太多
簡單的說就是利用輸入的字去和資料庫中的詞做比對,權重高的詞抓出來然後顯示
至於實作方面,不想訓練資料庫就好好利用GOOGLE就可以了
雲的時代,通通交給雲 XD
leo7w076sc
一般會員


發表:6
回覆:7
積分:2
註冊:2010-08-10

發送簡訊給我
#3 引用回覆 回覆 發表時間:2012-12-04 22:33:00 IP:220.135.xxx.xxx 訂閱
謝謝您的回覆!
我確實是用單機資料庫來弄斷詞程式
您說的"權重高的詞抓出來然後顯示"這是我下一步才要做的事情,利用bigram的構詞率來達成
至於顯示出所有斷詞組合也已經自己弄好了
以我發問的例子為例:
今天天氣好
先用list做出:今->今天
天->天氣

再利用一個stack加上動態規劃即可組合出所有可能
這是我的做法
給將來需要做斷詞的人參考

系統時間:2017-12-13 4:06:45
聯絡我們 | Delphi K.Top討論版
本站聲明
1. 本論壇為無營利行為之開放平台,所有文章都是由網友自行張貼,如牽涉到法律糾紛一切與本站無關。
2. 假如網友發表之內容涉及侵權,而損及您的利益,請立即通知版主刪除。
3. 請勿批評中華民國元首及政府或批評各政黨,是藍是綠本站無權干涉,但這裡不是政治性論壇!