中間體字

0  

創造把繁體字和簡體字同樣表示的字體,而附加『妥協字』,可以創造特別的可以自動切換中文的字體系列。

YAML 想法

平時,我們創造一個英文的網站的時候沒有需要區別『澳大利亞英文』和『愛爾蘭英文』等英文。其實中文的情況下也應該是類似的事情:應該沒有需要寫繁體字和簡體字的不同網站版本。從我的觀點來看,繁體字還是簡體字,只是一點像『粗體』和『斜體』之類的差別。但是,對搜索引擎來說,繁體字和簡體字有不同的字節碼(比如,體=0x9AD4, 體=0x4F53)。這個做法的優點是可以別改變字體,在一個文章裏說話關於用兩種的字體寫的內容。但是,實際上,這些元需要很少見的:我們平時在一個文章裏使用只繁體字或者只簡體字。如果需要用兩種字,沒有問題,因爲現代的所有的字體系列都在做這個區別(體=0x9AD4, 體=0x4F53 表示不一樣)。

對我像一個開發者,最方便的(不需要編程)的方法如何對一個用戶把 體=0x9AD4, 體=0x4F53 表示一樣,不是一個翻譯表,而是創造特別的字體: 就把 體=0x9AD4, 體=0x4F53 表示一樣的字體。用着這樣的字體,我們就不會丟掉編碼的意義,但是對人的讀者來說可以無編程切換表示。

當然,這個做法有一個缺點。[libberro]先生說過的特例,就是:

  • 發明 頭髮
  • 發明 頭髮

在簡體字,發明和頭髮都有一樣的『發』的寫法。因爲這種的各種特例,只是改變字體不可以完全解決切換的問題。

那麼,『中間體字』如何會解決這個問題呢?

我覺得,對這些所有的特例,我們可以創造個新的『妥協字』,比如,利用像特徵向量加法,合併最漂亮的『發』,『發』,『髮』 每個存在的特徵到一個半繁半簡的『妥協字』。這樣,繁體字的讀者不會感覺『髮明』或者『頭發』的不舒服性,因爲會看到『❏明』,『頭❏』,那裏❏是一個新的漂亮的『妥協字』。

當然,這個做法對每個字體系列會需要創造兩個字體:一個把所有的繁體字表示爲簡體字的字體,而且一個把所有的簡體字表示爲繁體字的字體。



(別通知) (可選) 請,登錄