文書處理 - [碎碎唸]試算表編輯過程的遭遇與抱怨 - 電腦

前往內容


[碎碎唸]試算表編輯過程的遭遇與抱怨

[碎碎唸]試算表編輯過程的遭遇與抱怨:
一段時間之前,自從用我個人有限的英語程度,和從加拿大英語區來臺探親的混血兒姪子、姪女們聊過天之後(當下的姪子、姪女們的年齡層約在 小四~大二),我開始嘗試看看構思編製我想像中的「正體中文漢字/國字+國語語音(國語注音符號體系)+國語注音符號第二式」自修學習懶人包教材(適合英語系的外國人來閱讀)。
我嘗試規劃以LibreOffice Calc 6.X ODS格式單一檔案來呈現這樣的懶人包。裡頭會參考中華民國政府單位所公告的各種規範資料,來呈現國字的常用字、次常用字、國語語音、部首、部件等等資料。資料源預設全部都找網路上「現成既有」的東西來拼湊重組(中華民國政府官方公告資料優先參考)。
首先就是國語注音符號組合全列表的收集整理,我參考了 行政院國家發展委員會全字庫、教育部國語一字多音審定表民國一零一年版、教育部重編國語辭典修訂本、幾個網路次文化發音組合(範例:注音符號 被 mobile01 禁用了),三十七個注音符號本身也列入,最後我個人整理出了1587組的注音符號組合,這些注音符號組合都是所謂理論上口語人聲發得出音的。
接下來我想要找出「現成既有」、「馬上可應用」的且能對應這1587組注音符號組合的國語語音單音檔(我有試過自己發音,結果就是有一小部分的發音組合,我自己的口語唸出來的效果,真得不好)。
我找到了gcin國語語音檔,音檔數量不足,因故也先略過。
我找到了工研院文字轉語音Web服務,在其網頁試聽其效果,音感聽起來悶悶的,我個人覺得聲音品質「不理想」。
我找到了MacOSX(10.13)系統附帶的國語語音Mei-Jia(預設沒裝,要另外下載),有部分的國語單音發音會有明顯的「音不對」的狀況。(我目前還沒有把1587組發音全部試聽完,我還在考慮,當我全部試聽完之後,要不要專程跑一趟臺北一零一的蘋果直營店去反應問題)。
我找到了行政院國發會全字庫網站上的男/女聲語音檔,其網站有問題,帶輕聲符號的注音組合發聲圖示點選播放後會有錯誤訊息,無法播放,然後女聲的效果其語氣像在罵人,第一次聽到有可能會被嚇到,也有部份漢字有注音符號標示,卻沒有國語語音檔搭配的「資料缺漏」狀況。
也就是說目前為止,因為我個人的網路資料搜尋能力有限,我「找不到」「現成既有」的、「馬上可應用」的、「沒有」各種奇怪細節問題的、能支援到非常接近1587組的「國語語音」「單音檔」。
我規劃的編輯過程是把國語語音單音檔當成聲檔物件插入ods檔中,這些單音檔容量其實不大,一個單音檔不超過20KB,我的想法是「一個」試算表檔案「打包」好要呈現的內容,一個檔案走天下(拆成多個檔案,就會有部分檔案遺失的風險)。
然而即使我的檔案編輯環境裝有16GB的主記憶體( MBP 13" 2010年款 ),LO 6.X Calc對於單檔被插入幾百個甚至數千個物件,還是會開始「運作遲鈍」,我是覺得不太合理,2018年了,軟體套件對於單檔容納了一定數量以上的物件這樣的應用情境,應該要呈現合理的運算效能才是。
接下來我參考全字庫第一字面、教育部重編國語辭典修訂本、教育部國語小字典、教育部4808個常用字表,整理出了五千九百多個常用字和次常用字(並做了某些懶人包風格的特色整理排序),然後我想整理出這五千九百多個字的每一個字拆分後的「漢字部件」到底有哪些。
我想要以「字形向量圖」所呈現的漢字部件來列出,結果發現全字庫的五一七個部件裡頭,卻有一百四十八個部件「沒有」對應的「字形向量圖」,只有20x20px的白底黑字點陣圖。
我反應給全字庫請對方補上缺漏的「字形向量圖」,全字庫卻叫我跑新增造字流程,我只好真的去跑實體公務文書流程申請新增字,2018年七月下旬申請的,到現在「審核」的結果如何?政府單位還是「沒消沒息」的。
因此有些感慨,當對岸中華人民共和國砸大錢在世界各地建立「孔子學院」的同時,中華民國臺灣政府公家機關,卻連「最基礎的」正體中文漢字/國字資料庫、國語語音資料庫的建立都是半套的、不完善的、細部瑕疵一堆的。
這樣怎麼能夠吸引外國人依據中華民國臺灣的既有資源來學習 正體中文漢字、國語 呢?
本人在mobile01發表之文章屬於本人之創作, 非經本人允許,mobile01不得任意額外使用.
繼續:
編輯試算表檔案的過程中,我光是排序1587組國語注音符號組合的「順序」,也一整個感覺厭煩。
根據 教育部「國語小字典」、我在198X世代末的義務教育階段的小學國語課所學到的注音符號排序、目前為止臺灣主流的個人電腦鍵盤上面印刷的注音符號。(mobile01 禁用注音符號) 這三個介音符號是擺在「中間位置」的。
但是根據 教育部國語注音符號手冊、重編國語辭典修訂本、國語辭典簡編本,(mobile01 禁用注音符號) 這三個介音符號是擺在「尾端位置」的。
好了,一個中華民國教育部,卻有「兩套標準」,(mobile01 禁用注音符號) 這三個介音符號 到底該擺在「中間位置」,還是「尾端位置」?
到底 「國語小字典」是對的?
還是 教育部國語注音符號手冊、重編國語辭典修訂本、國語辭典簡編本 是對的?
到底誰才是對的?
若 「國語小字典」是對的,那 教育部國語注音符號手冊、重編國語辭典修訂本、國語辭典簡編本「 應該立即」作出修正,讓教育部的四部國語字辭典的注音排序呈現一致性。
若 教育部國語注音符號手冊、重編國語辭典修訂本、國語辭典簡編本是對的,那 「國語小字典」「應該立即」作出修正,讓教育部的四部國語字辭典的注音排序呈現一致性。

不要叫我打電話去問教育部,我打電話去公家機關詢問政府單位的網站資料問題已經不只一次,對於多次遭遇公家機關的聯繫窗口在第一時間先推拖再說的「態度」,真的會「感到厭煩」。
本人在mobile01發表之文章屬於本人之創作, 非經本人允許,mobile01不得任意額外使用.
繼續2:
好幾年前的某天(201X世代),我在編輯LibreOffice Writer 文件,編輯過程使用到了 教育部標準宋體 和 教育部標準楷書 的「直書」破折號。
我的「古早印象」沒錯的話,中華民國教育部「規範」「直書」破折號「連續兩槓」要黏在一起,「連續兩槓」「中間」「不斷開」。
但是「當時的」「教育部標準宋體」 連續輸入兩次 「直書」破折號 ,中間「會斷開」,「當時的」「教育部標準楷書」 連續輸入兩次 「直書」破折號 ,「中間」「有黏在一起」。
我用fontforge打開這兩款字形去查閱「直書」破折號的「向量圖」,發現原因,教育部標準宋體 的「直書」破折號的向量圖 「沒有」畫到上下貼頂底。教育部標準楷書的「直書」破折號的向量圖則「有畫到上下貼頂底」。
我當時還真的很雞婆地打電話給中華民國教育部,反應這個問題,電話那一端的聯繫窗口,當場開MsWord來試。我說的沒錯,「直書」破折號「連續兩槓」確實「斷開了」。
「可是」電話那一端的聯繫窗口卻回應說:教育部只管「國字」本身有沒有問題,至於「標點符號」有沒有問題,他們「才不管」。聯繫窗口建議我,使用MsWord的文字間距微調功能,把連續兩槓合併在一起。
我的理解是,「當時的」教育部就是裝死不想修正「直書」破折號的向量圖就是了。

繼續3:
2012年左右,我在行政院旗下的全字庫網站查閱漢字資料,之後還跑實體公文流程往返、附上切結書、身分證影本跟政府單位索取全字庫背後的資料庫來做「加值應用」(利用試算表和進階純文字編輯器的搭配來編輯輸入法表格檔)。
光碟資料到手後分析資料,發現其中有一個格子內「理論上」應該要填入注音符號的「Mobile01禁用注音符號」,但是政府單位誤填為漢字小寫的「一」。
我打電話+email跟政府單位反應這個資料的瑕疵,政府單位當時的聯絡窗口在電話中回應我:「列印出來還不是都一樣」。
2018年的現在,全字庫的資料集被政府單位納入「政府開放資料平台」「可匿名免費直接下載」,下載頁面下方還有留言機制(雖然留言還是需要審核)。
於是我把六年前同樣的問題留言「再問一次」。這次在過了一週之後,更新版本的下載資料修正了我發現的資料瑕疵。
雖然人的肉眼上,乍看之下兩著都一樣沒錯,在電腦本身的資訊處理上 注音符號的「Mobile01禁用注音符號」 和 漢字小寫的「一」是兩個不一樣的東西。
另外,嚴格來說,真的去把教育部標準楷書裡頭的兩個一放大很多倍來看(向量圖),其實是不一樣的,有邊邊角角的細微差異。
這樣的過程讓我有些感慨,產生一種「解讀」,幾年前我就直接以電話和email跟公家機關反應問題,但這樣做的結果,被「吃案」的機率特別高。
但是當我採用一般民眾都可以瀏覽得到的網路留言機制反應問題,被「吃案」的機率就低了很多。

繼續4:
也是好幾年前的某天(201X世代),我google搜尋關鍵字「公文套件」然後在「國家檔案管理局」的「網站群」裡頭找到一個頁面是 openoffice公文套件 的介紹篇幅。
於是我開始在該頁面周圍和整個網站群嘗試尋找 openoffice公文套件 的下載點,然後我找了老半天「找不到」,於是我只好根據網站頁面最下方的公家機關聯繫電話,直接打去問,我需要知道 openoffice公文套件的「下載點」到底在哪裡?
聯繫窗口在聽完我的描述之後,簡單來說就是把皮球踢給了該網站的維護廠商A,我只好再打電話去該網站的維護廠商A詢問,維護廠商A聽完我的描述之後,把皮球踢給了該網站的維護廠商B,我只好再打電話給該網站的維護廠商B。
維護廠商B聽完我的描述之後,又把皮球踢給了公家機關的聯繫窗口,我只好再打電話回公家機關的聯繫窗口並描述了我已經問過了維護廠商A/B,公家機關的聯繫窗口仍然只會叫我再去問維護廠商A,就這樣成了一個循環,公家機關的聯繫窗口和維護廠商A/B不斷的來回循環踢皮球。
過了一段時日,我突發奇想,寫了email給我居住地範圍的立法委員吳育昇國會辦公室,描述我遭遇到的問題,隔了三天,立委助理來信也來電跟我確認了問題。
大約過了兩週,「國家檔案管理局」的「網站群」裡頭的 openoffice公文套件 的介紹篇幅頁面消失不見了,政府單位「沒有」選擇把 openoffice公文套件 檔案下載連結放上,而選擇了把 openoffice公文套件 的介紹篇幅頁面「下架」。
典型的治標不治本。我想想也是可悲,基本上完全同樣的問題「 openoffice公文套件的下載點到底在哪裡?」一般民眾打電話去公家機關問,公家機關踢皮球給網站維護廠商之後不了了之,換成立委國會辦公室打電話去問,公家機關則趕緊「下架網頁」。


---
額外話,Mobile01禁用注音符號 基本上就是「矯枉過正」。
本人在mobile01發表之文章屬於本人之創作, 非經本人允許,mobile01不得任意額外使用.

1頁 (共1頁)

前往