#舊 68 留言者:沒有我這個人 [2000-02-14] |
主題: 關於朱先生提到要發展語音輸入,我很好奇﹕像《尚書.盤庚》﹕「今汝聒聒,起信險膚」如此古奧的文辭,如何用語音輸入﹖就算是白話文好了,我讀幾十年前胡適或魯迅等人的白話文,也已感覺它們寫得不夠白話,這些文章要如何利用語音輸入建檔﹖自建詞庫或自動學習似乎都不是好的解決辦法。 |
回應﹕ 當今天下已經是一言堂了!老美呻吟一聲,人們便以為他們的方法就是聖典!錯了!我們的做法與他們全然不同,我們是以人為本,從刺激、感覺、辨認、理解下手,不需要建詞庫,沒有數學運算。我們根據聲音的分析,可以得出韻母、聲母,四聲(指普通話﹚、情緒以及個人特徵等。當然各地方的語音大有分別,因此我們有韻母及聲母的偏移分析,有文意理解的人性認知,有常識環境的主題範疇等,這些在西方的教科書中是沒有的。 什麼叫語音輸入呢﹖說穿了,就是「人機對講」!人與人不能對講就會形成隔閡,任何事窒礙難行,為什麼人與機器不需要溝通呢﹖當然要!現在我們是委屈自己,要學習機器語言。我所做的,是要機器學人的語言,學會了用語音講出來就可以,故稱。至於講者的內容,那要看做什麼,今人用今語,又有幾個人真正瞭解什麼了﹖那些無知無識的可憐人,只能以語言溝通,我對知識份子的需求沒興趣,這些是為大眾設計的。至於「今汝聒聒」可以以「今天」的「今」,「你」的「汝」,「聒噪」的「聒」輸入即可。就如平常人說「耳東陳」,「口天吳」一般。或以倉頡碼來輸入,例「今」的「人戈弓」、「OIN」,「聒」的「尸十竹十口」、「SJHJR」。 等資料庫連通後,只要說出尚書.盤庚,自然該篇就在記憶體中,等著比對了。 |
#舊 68 留言者:沒有我這個人 [2000-02-14] |
主題: 關於朱先生提到要發展語音輸入,我很好奇﹕像《尚書.盤庚》﹕「今汝聒聒,起信險膚」如此古奧的文辭,如何用語音輸入﹖就算是白話文好了,我讀幾十年前胡適或魯迅等人的白話文,也已感覺它們寫得不夠白話,這些文章要如何利用語音輸入建檔﹖自建詞庫或自動學習似乎都不是好的解決辦法。 |
回應﹕ 當今天下已經是一言堂了!老美呻吟一聲,人們便以為他們的方法就是聖典!錯了!我們的做法與他們全然不同,我們是以人為本,從刺激、感覺、辨認、理解下手,不需要建詞庫,沒有數學運算。我們根據聲音的分析,可以得出韻母、聲母,四聲(指普通話﹚、情緒以及個人特徵等。當然各地方的語音大有分別,因此我們有韻母及聲母的偏移分析,有文意理解的人性認知,有常識環境的主題範疇等,這些在西方的教科書中是沒有的。 什麼叫語音輸入呢﹖說穿了,就是「人機對講」!人與人不能對講就會形成隔閡,任何事窒礙難行,為什麼人與機器不需要溝通呢﹖當然要!現在我們是委屈自己,要學習機器語言。我所做的,是要機器學人的語言,學會了用語音講出來就可以,故稱。至於講者的內容,那要看做什麼,今人用今語,又有幾個人真正瞭解什麼了﹖那些無知無識的可憐人,只能以語言溝通,我對知識份子的需求沒興趣,這些是為大眾設計的。至於「今汝聒聒」可以以「今天」的「今」,「你」的「汝」,「聒噪」的「聒」輸入即可。就如平常人說「耳東陳」,「口天吳」一般。或以倉頡碼來輸入,例「今」的「人戈弓」、「OIN」,「聒」的「尸十竹十口」、「SJHJR」。 等資料庫連通後,只要說出尚書.盤庚,自然該篇就在記憶體中,等著比對了。 |
#舊 69 留言者:沒有我這個人 [2000-02-15] |
主題: 現在市面上已有不少語音輸入工具,清一色都是為大眾設計的,朱先生又何需錦上添花﹖若說這些語音輸入工具都有缺陷才要重新開發,那麼這些工具的缺陷是什麼﹖如何補救﹖ |
回應﹕ 1,全球已上市之語音套件,皆屬「數學統計」法所完成者,君不信,此類書籍在書局起碼找得到十種以上。語音輸入這麼重要的技術,其價值可以說是當今微軟視窗的百倍以上。蓋不僅全世界人人需要,而且是所有的機器、儀器、工具等,只要是人用的,都需要理解人意,才能作有效的服務,稱為「智慧」機器!這種技術,難道老美會「賤賣」嗎﹖所以,我不認為那種產品叫語音輸入,那只是把一些訊號,統計出平均值而已,作為兒童玩具可也。 2,我不能在此細談,不是為了要「貴賣」,而是技術上涉及領域太廣。我所做的一切,不論是理論、技術、方法,都與時賢「格格不入」,可能我錯了,帶進棺材可也。萬一我是對的,人類知識將大搬風,讓下一代去學吧!自己美其名為人類服務,卻又把主流的知識份子貶得一文不值,何必呢﹖我知道自己是對的,真理不辯亦明,足矣! |
#舊 69 留言者:沒有我這個人 [2000-02-15] |
主題: 現在市面上已有不少語音輸入工具,清一色都是為大眾設計的,朱先生又何需錦上添花﹖若說這些語音輸入工具都有缺陷才要重新開發,那麼這些工具的缺陷是什麼﹖如何補救﹖ |
回應﹕ 1,全球已上市之語音套件,皆屬「數學統計」法所完成者,君不信,此類書籍在書局起碼找得到十種以上。語音輸入這麼重要的技術,其價值可以說是當今微軟視窗的百倍以上。蓋不僅全世界人人需要,而且是所有的機器、儀器、工具等,只要是人用的,都需要理解人意,才能作有效的服務,稱為「智慧」機器!這種技術,難道老美會「賤賣」嗎﹖所以,我不認為那種產品叫語音輸入,那只是把一些訊號,統計出平均值而已,作為兒童玩具可也。 2,我不能在此細談,不是為了要「貴賣」,而是技術上涉及領域太廣。我所做的一切,不論是理論、技術、方法,都與時賢「格格不入」,可能我錯了,帶進棺材可也。萬一我是對的,人類知識將大搬風,讓下一代去學吧!自己美其名為人類服務,卻又把主流的知識份子貶得一文不值,何必呢﹖我知道自己是對的,真理不辯亦明,足矣! |
#舊 122 留言者:沒有我這個人 [2000-05-08] |
主題: 關於此題,朱先生之結論極是,然言斷句乃"西化之後遺症"則非。古人為書作注,實即為古書斷句。「常無,欲以觀其妙……」乃晉時王弼所作之句讀,「治世之音安,以樂其政和……」乃唐時陸德明引一讀。句讀雖誤,其時豈有所謂"西化之後遺症"﹖流沙墜簡文旁勾識,又何來"西化之後遺症"﹖ |
回應﹕ 感謝網友們有以教我,的確「斷句」並非西化之後遺症(查「句讀」與「斷句」皆屬主觀,「西化後遺症」係指強迫大眾接受)。該說乃老子之《道德經》中,『有人斷以「故常無,欲以觀其妙…」而印行成書』,這才是西化之後遺症也。 敝人兒時在先父督促下,強學「古文之斷句」,初頗以為苦。記得每斷一次,則以色筆圈之點之,還要作「眉批、腳注」,今始能知古文之妙。曾見報載,美國學生數學程度低落,是自幼放棄「心算」,大量應用「計算器」的結果。人之大腦愈用愈活,不用則廢,是福是禍﹖白話文講究明確,當用「西式標點符號」,但欲知古人原意則不宜也。 |
#舊 126 留言者:沒有我這個人 [2000-05-10] |
主題: 魏晉玄學重心在"無",裴頠〈崇有論〉因此而發.王弼注《老子》,「故常無欲以觀其妙;常有欲以觀其徼」兩"欲"皆屬下讀,則"有""無"二字正是主詞,不論正誤,如此斷句,乃時代風氣使然.朱先生以之為"西化之後遺症",不知所謂西化,始於何時﹖佛教東來乎﹖ |
回應﹕ 多謝指教。玄不可談,可談者不玄,故有晉一代,於文化上貢獻不大。古文原是種客觀文體,各人有自行「斷句」的自由。今資訊發達,但「文化盲」也相對增多,僅不知古人原意尚無損失,若因「個人主觀」之扭曲而生誤解,那就很難說了。 所謂「西化」,在愚見可以解釋為﹕「學習西方思維,追求自我利益,重視時效的趨勢」(因本人時間有限,未曾慎思,請勿對此浪費筆墨﹚。因此,有人為了創新,不取經過多數人客觀接受的斷句﹕「無欲、有欲」,老朽便「主觀」加以定義為「西化」。 真理不辯才明,對此事,恕本人不再答覆,請原諒。 |
#舊 138 留言者:沒有我這個人 [2000-05-17] |
主題: 防制盜版電子書似無必要.有人願意主動流通自己的著作不是很好嗎﹖ 既然現在軟體系統都強調Public License,朱先生自己也早已放棄倉頡輸入法版權,卻保護電子書不被盜版,未免顯得太過怪異.只要不刪節原文,就隨他去吧! |
回應﹕ 多謝讜論,此為理想,不幸所謂「人間」,乃係「人人之間」。人人皆有理想,各人之理想又各有不同之立場(此乃宇宙的機制,任一物體皆佔有不同之座標位置﹚,為了扞衛「自我的立場」(自衛無罪﹖﹚,無所不用其極,於是天下亂矣! 電書是「公器」,若缺共識(內容的提供者,器材的生產者,資訊的閱讀者﹚,三者缺其一,「鼎折其足」,則僅屬「倒仆」之理想矣。 著作權的保護是延續「西方的法制」,時代以「倍速」在改變,但人是一種「半絕緣體」,觀念落後甚遠(常有終生不變其志的頑石,如老朽然﹚。鼎雖三足,不齊不立,共識須相互容忍,否則無異玉石俱焚也。 |
#舊 191 留言者:沒有我這個人 [2000-06-15] |
主題: 剛剛得知:大陸的國家科學院和新加坡的Donovan Systems合作,研發出來64位元的 Linux作業系統"中國企鵝"Chinese Penguin64,號稱全球第一套真正的中文作業系統。 |
回應﹕ 好極了,這才是自強之道,老朽樂見其成。 |
#舊 198 留言者:沒有我這個人 [2000-06-19] |
主題: 順便說一下中文2000的收字情況,究竟收錄多少漢字,採用何種內碼或交換碼﹖謝謝! |
回應﹕ 中文2000很「可能」會分兩個版本,目前正在研究中。由於「市場考量」,第一種字庫收三萬字(含ISO10646,大五碼,國標碼及港澳用字,存於CPU中,約佔128KB﹚。第二種為SUPERCJK(含中、日、韓、越南之漢字﹚近八萬字,空間增加一倍。事實上,這八萬多字九成以上的系統用不著,所以我們打算以第一套廉價服務電書廠商,第二套則用來營利。 至於字碼,為省空間(UNICODE一字四字元,僅三萬字就佔了120KB,八萬字320KB,加上輸入碼又需數倍以上,老朽不敢領教﹚,一概採用倉頡內碼(完全不佔空間,若用二字元之倉頡交換碼,也只佔64KB﹚。 這些對照碼表,待CPU完成後,一律免費公開。 |