[ 3/3 ] 自己的 迷你 即時 翻譯軟體

/////////////////////////////////////
Release Date: 2009/03/03
/////////////////////////////////////

話說小弟之前寫了一些單字小遊戲:
http://www.mobile01.com/topicdetail.php?f=129&t=918269&last=10078307

手上有一些字庫 覺得只用在遊戲 有點小可惜.
最近小弟弄了個 即時翻譯 軟體 來吃 原本的字庫.
畫面如下:



兩張圖分別從瀏覽 CNN 網頁 跟 Google blog 時抓下, 僅為說明用途, 另外綠框是為了說明用小畫家加上去的.

有興趣的朋友 請在這邊下載程式:
附加壓縮檔: 200903/mobile01-72465772f15bdf859fbfc9f02cac8c85.zip

小弟的環境是 WIN7, 剛剛用了 IE, Opera, Firefox, 看起來都有抓到字.
對了抓字的方法 是 滑鼠左鍵 點兩下, 目前無停駐掃描功能, 一定要去點兩下.
有在玩BVocabulary的玩家 字庫可以直接使用喔, 這個翻譯程式預設讀取同目錄下的 B21813.csv 當做字典檔.

P.S
1. 一樣需要裝 .net framework, 小弟都是裝 3.5 版的 OK, 3Q ~
2. 雖然保證無毒, 安全 不影響 磁碟 / registry, 但還是得先說明, 這是測試版.... 程式只有 75KB, 有興趣可以試試囉~
3. 也可以當翻譯機 自己 key 字 查囉 ~
2009-03-03 21:07 #1
bokiteam wrote:
話說小弟之前寫了一些...(恕刪)

很好用耶,隨然記憶體吃的多了一點

可以支援反向 中翻英 的功能嗎?

Wei_1144 wrote:
很好用耶,隨然記憶體...(恕刪)


多謝試用呀

疑? 記憶體從我電腦看是吃 11MB 多左右. 印象中 應該比 大部分的 少才對... (還是現在翻譯軟體都佔很小?)

找中文的話 應該沒有大問題 我會在下一版加加看這個功能.
BVocabulary
很棒的軟體~多多加油喔

話說~iphone也很需要這種軟體呢~~
samvigilia wrote:
很棒的軟體~多多加油...(恕刪)

但是iPhone要先官方支援"選取"阿...iPhone點兩下是放大縮小
[媽媽他給我打]
看了一下字庫,好像有些字大小寫不同,意義不同,但是抓不到正確的翻譯,例如 am 和 AM

字母排列相同,但是大小寫有差異的word:

ACT, 青蒿素
act, 行為
Advent, 降臨
advent, 到來
am, 是
AM, 上午
arctic, 北極
Arctic, 北極
bible, 聖經
Bible, 聖經
black, 黑色
Black, 黑色
brownie, 布朗尼
Brownie, 布朗尼
cabinet, 內閣
Cabinet, 內閣
Cancer, 癌症
cancer, 癌症
capitol, 卡皮特爾
Capitol, 國會
catholic, 天主教
Catholic, 天主教
cause, 事業
cause, 事業
Civil War, 內戰
civil war, 內戰
coke, 焦炭
Coke, 可口可樂
cola, 可口可樂
COLA, 可口可樂
communion, 共融
Communion, 聖餐
confederacy, 邦聯
Confederacy, 邦聯
confederate, 邦聯
Confederate, 邦聯
Congress, 會景餐廳
congress, 會景餐廳
Constitution, 憲法
constitution, 憲法
democratic, 民主
Democratic, 民主
Earth, 地球
earth, 地球
Father, 父親
father, 父親
fed, 美聯儲
Fed, 美聯儲
God, 上帝
god, 上帝
Gospel, 福音
gospel, 福音
holocaust, 大屠殺
Holocaust, 大屠殺
House, 房子
house, 房子
Junior, 初中
junior, 初中
Lent, 四旬期
lent, 借給
lord, 主
Lord, 主
Mandarin, 普通話
mandarin, 普通話
march, 3月
March, 3月
marine, 海洋
Marine, 海洋
mason, 梅森
Mason, 梅森
Mass, 質譜
mass, 大眾
May, 可能
may, 可能
Mecca, 麥加
mecca, 麥加
Mercury, 水星
mercury, 汞
miss, 想
Miss, 想
mount, 掛載
Mount, 山
or, 奧勒崗
OR, 奧勒崗
Orient, 東方
orient, 東方
oriental, 東方
Oriental, 東方
PA, 賓夕法尼亞
pa, 賓夕法尼亞
Pentagon, 五角大樓
pentagon, 五角大樓
pilgrim, 朝聖者
Pilgrim, 皮爾格林
PIN, 密碼
pin, 引腳
pole, 杆位
Pole, 北極
polish, 波蘭語
Polish, 波蘭語
president, 主席
President, 主席
Prohibition, 禁止
prohibition, 禁止
Puritan, 清教
puritan, 清教
ram, 內存
RAM, 內存
Representative, 代表
representative, 代表
Republican, 共和黨
republican, 共和黨
Resurrection, 復活
resurrection, 復活
RIP, RIP協議
rip, 瑞普
SAT, 國家稅務總局
sat, 星期六
savior, 救星
Savior, 救主
Scotch, 蘇格蘭
scotch, 蘇格蘭
Secretary, 秘書長
secretary, 秘書長
Senate, 參議院
senate, 參議院
Senator, 參議員
senator, 參議員
senior, 高級
Senior, 高級
sister, 姐妹
Sister, 姐妹
Sq., 平方米。
sq., 平方米
t., 噸
T., 噸
US, 美國
us, 我們
WASP, 黃蜂
wasp, 蜂
welsh, 威爾士語
Welsh, 威爾士語
western, 西部
Western, 西方
westerner, 西方人
Westerner, 毛子
white, 白色
White, 白色
yank, 拉
Yank, 簽約

可是,這樣很兩難耶,例如 westerner 如果放在句首,w就要大寫,那樣 西方人 就會變成 毛子 了,難怪西方人都喜歡說 lady first.

還有,點兩下不能選到句點,所以例如"Sq."就會抓不到
Wei_1144 wrote:
看了一下字庫,好像有...(恕刪)

大大會不會太強了
先解釋一下, 字庫翻譯是透過 google translate 翻好直接 copy & paste, 僅供大家參考, 歡迎自由修改.
翻譯的過程像這樣:
http://translate.google.com/translate_t?hl=en&sl=en&tl=zh-TW#en|zh-TW|cook%0Afood%0Awood%0Ahook%0Anook
一次大概可以餵3000 個英文單字左右, 再多好像會翻不出來.

回到問題, 如果沒記錯 目前程式的搜尋方法是 ignore 大小寫, 所以誰先被找到 就當答案 ..
程式可以改成 先看大小寫 找不到再忽略大小寫, 或其他方法 (ex: 全部列出來, 相似字...)

後面有點的話, 這部份牽涉到 擴展搜尋, 應該是可以做, 下一版 我會 try try ...
BVocabulary
看到這篇,覺得很有趣,因為突然想到,也許可以用 SNA 的方法,來分析與整理字根、型態變化、中英對照...等的關聯

想問問看網路上有沒有字數較多的字庫可以下載? 最多的字庫是哪一個? 有標註一個字是動詞、名詞、或形容詞嗎?


SNA的應用,簡單的,例如 找出同義字:

英文1 英文2 中文
awoke woke 醒來
awoke woken 醒來
axes axis 軸
axes shaft 軸
axiomatic self-evident 不言自明
axiomatic self-explanatory 不言自明
axis axes 軸
axis shaft 軸
B.A. bachelor 學士
babble gurgling 潺潺
baby infant 嬰兒
baby boom baby boomer 嬰兒潮
baby boomer baby boom 嬰兒潮
babysitter nanny 保姆
babysitter sitter 保姆
bachelor B.A. 學士
backbreaking toil 辛勞
backdrop background 背景
backdrop context 背景
backer supporter 支持者
backfire counterproductive 適得其反
background backdrop 背景
background context 背景
backhand backhanded 反手
backhanded backhand 反手
backing bolster 支持
backing support 支持
backing supportive 支持
backlash bounce 反彈
backlash rebound 反彈
backpack knapsack 背包
badge emblem 徽章
badge insignia 徽章
badlands wasteland 荒地
badly grave 嚴重
badly gravely 嚴重
...

還可以做很多事情,不過我最想做的是 整理字根字尾與型態變化
Wei_1144 wrote:
看到這篇,覺得很有趣...(恕刪)


這個嘛... 據小弟知道的 stardict 有很多字庫 (有的字庫達 40 多萬字) , 但非一般文字檔.

另外, Wordnet 沒記錯的話 是根據 詞性來編排, noun 一本字庫, verb 一本字庫 ...etc, 當然它是英英的.

談回 stardict, 已有 同意字 擴展 的功能, 不過小弟尚未研究 其擴展是根據什麼樣的條件來計算結果, 不過他有 open source, 有興趣的朋友 可以去下載來看看.
BVocabulary
限制級
您即將進入之討論頁 需滿18歲 方可瀏覽。
提醒:內容可能因過於寫實、驚悚而令人感到不舒服,是否繼續觀看?

根據「電腦網路內容分級處理辦法」修正條文第六條第三款規定,已於該限制級網頁,依台灣網站分級推廣基金會規定作標示。
評分
複製連結