轉简體   復原    
舊 12 留言者:網主 [1998-12-12]
告網友:
  近日多瑣事,台灣之行順利,中文CPU暫且生產十萬顆,九月交貨。月初赴港,與科學院軟件研究所孫玉芳副所長會商,中文2000已經可用,但須待字庫完成。孫所長表示國內也有生產晶片的能力,量產也不是問題,可望進一步合作。另又與華懋集團商討文化教育事宜,可喜者有心人士頗多,若能團結,光明在望。
然而喜中有憂,自五四西化開始迄今,老二主義盛行,世人唯知「馬首是瞻」,卻不究「馬首」為何。教育界渾忘了「教化培育人才」的責任,一味以「販賣知識」為榮。其結果是,知識份子高居象牙塔,人人急功近利,竭澤而漁,直至地球毀滅而後已!
由於小露鋒芒,致訪客不斷,有礙研究工作進度。為了專心研發,特搬至一個偏僻之處,又應了每年搬一次家的惡咒矣!
舊 13 留言者:網主 [1998-12-12]
告網友:
  人生登山路,同行需惜福,緣起遠亦近,緣去有更無。
  老朽「出家」二十載矣,今日唯天下貧苦蒼生(複數,非單數﹚是念,「親朋好友」概不來往,「志同道合」網上相聚。
  所可告慰天下者,此生清白,未染銅臭。居工作室之側,進食堂之餐,一年四季,一周七天,唯工作責任是問。今為實踐理想,受聘就業,所得薪資,一概捐為文化基金﹔所持股票,全數分給工作同仁(惜已捐畢,無餘可分)。
  《金剛經》云:「人以滿無量阿僧祇世界七寶持用布施,未若持用此經,乃至四句偈等(四句偈:一切有為法,如夢幻泡影,如露亦如電,應作如是觀﹚。」
  不求認識人生,所作皆妄,不先瞭解對方,所求更妄。找老朽投資,是妄﹔動老朽以情,是妄﹔逼老朽以力,是妄﹔誘老朽以名利,是妄上加妄。
  陽關大道有人走,青山小溪魚蝦游;嘻笑怒罵任人去,成敗得失各自求。
  順頌業綏
舊 15 留言者:網主 [1998-12-12]
告網友:
  常有網友來函,對中文電書建議良多,老朽在此敬致謝意。唯老朽本非資訊界人士,置身「危地」,僅因見及人類(進化中之一物種﹚面臨沒落,少數人為所欲為,而舉世皆蒙在鼓中。古人有言「常使民無知無欲,使夫智者不敢為也」,而今「大道廢,有仁義﹔智慧出,有大偽」。老朽無德無能,不過釜底抽薪,希望使「大眾有知,智者無欲」。資訊工具適逢其會,老朽「越俎代庖」,「勉為其難」,並非有志於此也。
老朽一向稟著人棄我取,人爭我離的態度,專心致力於乏人問津之築基工作。中文字庫(華康字庫若能解決問題,當立刻讓賢﹚、電子書以及中文作業系統(誰的功能強、成本低就給誰做﹚等等,無一例外。但單絲不成線,獨木難為林,本系統之各種應用軟體,一律公開,希望國人共同發展,切勿心存觀望,洋貨早氾濫成災矣。
祇緣大業初創,無法先行發佈程式界面及系統規範,尚請稍待。此外,基於「公平原則」,若要公開,目前自不能多說,以免「內線交易」也。可以說明的是,我們開發的平台,其軟硬體環境與當前系統兼容,稍有經驗即可一展雄風。
本工程最大的特色,係將中文「應用瓶頸」清除,無論「字、碼」皆已資訊化。其次為降低成本,令窮人不虞匱乏,迎頭趕上(目前在籌劃另一「革命」,如果可「行」,將令上網成為「家常便飯」。但限於商機,未便多說,不久即知分曉﹚。
老朽曾言,資訊技術僅為一種過渡工具,一種暫用的法門。人生事大,身外之物本無所住,怎能擅專﹖盼有志者準而備之,舞台搭起,好戲即將開鑼矣!
舊 17 留言者:網主 [1998-12-12]
告網友:
  近來「西線無戰事」,正宜「試放空包彈」,累思用一個實例,來探討「思維的方法」,以饗網友。如今有了,特開班「午夜東方快車」,談談漢字字庫的設計理念。關於這件事,老朽早在「未老先衰」的二十年前,即在《中文電腦漫談》中詳細介紹過,後來又在《熱訊》雜誌上,公開了一些原程式。現在「日薄西山」,還要「重操賤業」,何也﹖非閒得無聊,無事可做,實為責任未了,身不由己也。
  首先,先談「動機」,以自暴己短。三十年前,我已了悟生死玄關,自許:「地獄不空,誓不成佛」。正因「四大皆空」,才能一眼就看到「資訊時代」的真相﹔曾是「天涯淪落人」,所以頗知「眾生疾苦」。人生無從解脫之夢魘,非貧於金錢物質之不足,而係困於生命意義之矇瞀。「資訊」流傳千古,道貫「天人」,若善用之,是黑暗中之明燈﹔但誤傳之,則如鬧市之車鳴。心動了,起而行,工未竟,以死繼之。
  「立場」不必討論,生為中國人,設若忘了自己是誰,活著猶如「行動的火腿」。中國人之所以為中國人,無他,「文字化育」之功也(沒有「文化」的人當然沒有﹚。
  這一來,「目的」就躍然而出了,在這個「東西方文化衝突的時代」,位居「弱勢」的「東方」,面臨「西風無力百花殘」。是固有文化沒有價值乎﹖若然,老朽之「得救」豈非「自欺」﹖是耶非耶﹖有待實證,思之無益。目前地獄正熾,且藉獻身中文資訊,一頭栽入這個洪流煉爐,為滿足眾生需求以知端的。
  在這個目的下,不具功利,沒有成敗,一切無住於心。正如《道德經》第五章所示:「天地之間,其猶籥乎﹖虛而不屈,動而愈出。」當自己心中沒有被私利充斥的時候,腦筋越來越清楚,視野也越來越廣闊。對世俗人,我是個「怪物」(我承認是的,在地獄中,只有怪物才能跟魔王打交道﹚,而我的步履卻日益堅定。
  料不到,我在從事資訊工程(真正的資訊工程並非製作工具,而是文化資源的整理﹚的機會中,為了徹底解決問題,摒除萬難,最後得以「直搗黃龍」,發現了「漢字基因」。說實話,漢字基因也就是人類的「思維基因」,確是我始料未及的。
  《道德經》第二十九章:「天下神器,不可為也,不可執也。為者敗之,執者失之。」(老朽生平讀書不多,只得緊抓住老子不放。﹚這二十年來,成敗得失雖不在心上,但卻找不到一個「有德真君」,足令我「肝腦塗地」,於是只好「自放自娛」了。
  現在,機會來了(何嘗不是惡夢﹚,文化傳信雖是個不足道介的小公司,但「主事者」之襟懷心胸,足夠容納天下蒼生,余何人也﹖能自命清高、心存貴賤乎﹖
  於是自去年起,本著「愚公移山」之精神(為人所不為,修道之必修﹚,「老朽填海」來也。由佈局撒網,到論理定向,進而集資招賢,開始了「農民網」、「電子書」等工程。今年四月,公司決定生產「中文中樞」,正式邁向漢字基因工程。
  問題出在近來電玩市場大旺,資訊業界缺貨,以致電書樣品所需之186CPU遍尋不得。弟子們慌了手腳,特別建議:「用C語言寫字庫可以避免CPU選擇的困擾。」當然不可!這是個思維的範例,分析如次,以供喜愛思考的網友們參考。
  「思考」是為了要「判斷」,而判斷的方法,則是根據「目的」逐項分析(限於篇幅,僅取重點﹚。老朽之「目的」已述於前,是解決眾人之問題(將別人的痛苦,建立在自己身上﹚,以求保存東方文化於世,不致為當今「狂烈風暴」所毀。
  首先要知道,「眾人的問題」是什麼﹖「資質平凡」、「資金不足」、「資訊缺乏」,人之「三資」要件是也(本文採反向思考法,舉三反一﹚。
  俗人對資質高低的判斷,是以「成敗論英雄」,不幸真「英雄」少,假「狗熊」多。所以頭腦不清的「平凡」人,總自認為是資質平凡故(更不幸被碰對了一半﹚。一旦「平凡」人飛黃騰達了,家財、身價、觀感一一暴發,可謂狗熊肥大了。
  當今「資訊」工業領軍,資金浮泛,本文所指的是「利益未得」者。一人得道,雞犬昇天,不必自誇奇蹟,人人昇天才是真奇蹟。
  其實,人之資質來自教育及學習,人之資金來自知識及生產,所以,「資訊」的多少才是「眾人問題」的焦點。因此,下文僅討論資訊,其餘可免。
  一談資訊,有人自以為是(資訊暴發戶﹚,有人視若畏途(資訊貧困戶﹚。其實大可不必,有個故事,可以供作認知的參考。
  某地有個玉匠,其作品雕工精細,風格清新,馳名遠近。後來他發現有人以電鋸、電鑽施工,速度快捷,立可大量生產。某一時心動,倣而效之,雖雕工粗劣,但產量大增,收入直線上升。不久,市面上劣玉充斥,愛玉乏人,終至失業而後止。某悟而悔之,再執雕刀,重操舊業,不料大刀闊斧慣了,精細的雕刀簡直無法上手。
  君不見故宮之玉白菜﹖當今出土之寶玉堆積如山,手執電鑽的工匠也數以萬計,然而有價值的精品有誰見來﹖
  雕刀者,「組合語言」﹔電鑽者,「C語言」﹔中文字庫相當於「璞玉」,我輩則為前述之「工匠」(再舉一例,C語言有如厚厚的手套,組合語言等於是張薄膜,要動手從事危險工作,當然要戴手套,如要從事精密的細節,手套愈厚,麻煩愈大﹚。
  如果目的是為了商業利益,自以大刀闊斧為宜﹔如為大眾利益,應能符合大眾所需。大眾(指貧苦者而言﹚所需者,為用最少的資金,換得最大的資訊效益。再以資訊工程的立場,最低的成本,當指最低的資金支出。
  以實例來說,華康字算是夠標準了,那是用C語言、「邊緣描述」技術所做,他們花了數十位技師,五年的代價做出來的。他們一共有三萬兩千字,十六套字形,總共數千萬字元(概數,記憶不全﹚,全部軟體之售價約需二百美金。
  若全中國人都要採用,那當然是天文數字,再若製成硬體(軟體價值不論﹚,其成本也要三、四十美金。我們用組合語言,我寫程式(全世界最老的組合語言程式員﹚,沈紅蓮做資料(她一絲不苟正是我的噩夢﹚,尚有幾位弟子幫忙,迄今只花了兩個多月,就已接近完成(目前是三萬多標準字的版本,只用了128KB,八萬字集只要再加資料即可,約為200KB,成本不到華康的千分之一,當然其他的硬體成本另加﹚。
  文昌一號CPU已經動工,因為改變設計,要延到十月生產。文昌二號打算自行設計CPU的微指令,再用「閘列(Gate Array﹚」的模擬方式,交付生產。設計CPU並不難,難在各種編譯器以及開發環境等,但本字庫既然僅供「漢字工程」應用,對一般業界,公開介面規格就夠了。最妙的是,用自己開發的組合語言,反而不怕別人破解與抄襲(這點至關重要,蓋已非「商業利益」,而是「意識型態」之爭也﹚。
  這一來,連「判斷」都免了,C語言對我們還有什麼用呢﹖
舊 18 留言者:網主 [1998-12-12]
告網友:
  老朽美國一行,前後84小時,其中在飛機上33小時,機場12小時,扣除「休息」公洽不過三個小時。此行收穫頗豐(電書成本約降低兩成﹚,但因一點細微的疏忽,導致「天下大亂」,演出一幕兩國四地超級動員之「鬧劇」。事後詳之,無「巧」無戲,其「妙」無比,特草作一「劇本」,名為「人算不如天算」,正好供下一個階段「多媒體」暖身(廉價電書一出,農民網迎刃而解,餘事盡屬「業務」,老朽責任已了矣﹚。因近日事忙(中科院軟件所人員來此會商中文2000事宜﹚,下週當公佈在「網上雜文」中,對人生機緣有興趣者可自行參詳,以搏一粲。
舊 21 留言者:網主 [1998-12-12]
告網友:
  「天道往還,中華必興」!老朽預言在此,不久(數月之內﹚世人將一新耳目也!
老朽日昨應邀,與一「震古鑠今」之奇才相晤。此人(千里馬外加伯樂﹚凜於中國算盤的「奧妙」,窮十五年之功,發明了炎黃世冑「道地」的CPU。其原理用「算盤基因」:「天–數:混合進位制」,「地–體:對稱、多堆棧」,「人=用:超長指令」。
所謂混合進位制,算珠分兩類,上二珠逢二進一,為二進﹔下珠逢五進一,屬五進﹔設上珠五,下珠一,是十進,合之為十六進位。再若以變數視之,各珠代表不同之值,任何進位皆屬可能(懂CPU精髓者,應知其妙也﹚。
古代早有堆棧之說:「譬如堆棧,後來居上」,計算機之核心觀念即此。但單一堆棧功效不彰,算盤之柱形成「可平行處理之多堆棧」,對稱形又可雙向延伸,無限擴展。
超長指令即「口訣」,人記之熟練,即可循序操作。此類「口訣」即相當電腦「指令」,且不等長。因此妥善設計此類「指令」,配合天地機制,大局已成。
下週老朽將去北京,專門學習此技術之應用,以便開發下一代「中文CPU」。確知此技術效率高出西方者甚多(迄今電腦尚未打敗人所撥弄之算盤﹚,西方人人稱奇,然國人限於「眼界心術」,目前尚「咬牙切齒」堅決不信。老朽閱人無數,識技於微,未曾「走眼」,今見證於此,與熱愛中華文化之網友們同慶,阿彌陀佛!
舊 22 留言者:網主 [1998-12-12]
告網友:
  此次赴京,收穫至大,除涉及「商機」部份必須保密外(最多到九月即可解密﹚,各種關鍵之訊息與技術,皆可與網友分享。其原因無他,如係「科學」,就應該接受質詢及考驗。再若與我傳統文化之價值有關,時國人「民族自信心」已經破產,老朽不思發揚光大,尚自據為「私有」,其莫非「老賊」乎﹖
「算盤基因」經證實為真,其事頗為曲折,其人之名亦不能洩。因涉及某敏感單位之作業,尚請網友以「大局」為重,不必再問,時至自明。
大陸科學界對此CPU確有反對的聲音,但非針對其理論,而係「年輕人」不知「做人」之道,以致四面楚歌。今人讀史,至王安石「變法」,往往掩卷三嘆,歷史豈可重演﹖老朽素喜息事寧人,略事週旋,談笑間已將矛盾化解。細觀大陸與台灣各界之別,前者「有國可愛」,後者「有情可獨鍾」,一長一消,三年後兩者將若天淵也。
老朽行前,曾在網上提出「複數系多媒體」模組,經與該奇人(以下假定其名為X﹚討論,雙方見解一致,已進入硬體設計階段。
西方之CPU技術,局限在馮氏的「一個時鐘週期,執行一個指令」的迷思中。而「算盤基因」將每一算子視作一獨立運作之「指令」,各「柱」相當於「串行機制」,用者可任意採用不同的「進位」數系。理論很簡單,卻正如由「天動說」到「地動說」一般,教會迄今仍遵從聖經,無損其信念,而在科學實用上,地動則成為主流。
「X」將最基礎的「邏輯閘」設計成為「算子」,再用「堆棧」作為「算柱」,一層一層堆疊上去,遂築成「無限」層次的「宏指令」。使用者可以利用其機制,自行設計所需要的「宏指令」,甚至可以使用「自定語言」。
因老朽曾有此念,故一見即明,絕非出於偏見或穿鑿附會。
請恕老朽工作繁忙,時日有限,所幸此技術不久即將公開,本網不再贅言。
另有一重大成就,亦希望與網友分享(與算盤基因一樣,老朽所言「重大」者,係指對國家民族而言,一般人民未必知之也﹚。「漢文化資訊聯盟」發起人之一欒貴民與田奕教授,已完成了「中華文獻資料庫」,上自先秦下迄清末,鉅細無遺,一概建檔入庫。
由於欒教授與老朽理念相若,八年前彼此約定,誓為中文資訊鼎力奉獻。時至今日,但見坊間各種文化光碟風行,諸如「四庫全書」(已上市者有四種﹚、中華醫典、大中華百科全書等,令人眼花撩亂。外行人以之為傲,識者引以為憂。其憂者何﹖非僅無端浪費人力、物力,抑且誤導社會大眾,以為中文資訊「止」於此矣!
「文獻資料庫」必須經過詳盡的「考證」,資料應完整,版本有權威,內容要正確。欒教授出身北大,師事前社科院院長錢鍾書(魯迅、胡適時代人物﹚、楊絳(錢之夫人,唐吉訶德之譯者﹚,錢為中國頂尖之「文獻考古」專家,尤長宋詩。
資料庫之關鍵問題在「中文字碼」,試想,以6763字如何表達一些極為罕用的「中藥」名稱﹖再談「百科全書」,中文除了漢字,尚有其他,若數萬漢字都已闕如,此「百科全書」是否果真只有「一百科」﹖
欒教授開始就採用老朽之倉頡碼,不僅字全,而且有「字序」可用(字序與英文字母相同﹚。多年來,老朽一再強調字序的重要性,然無人理睬。今經欒教授證實,採用老朽之系統,其「原文檢索」之效益,較諸其他方式,約快上千百倍,皆字序之功也!
字序對檢索功能之效應,與資料量呈幾何級數上升。對行不過百尺之「鳩、蜩」,百冊之書已是極限,自然毫無意義。然文化資料浩如瀚海,設若檢索效率不彰,一語一句宛似大海撈針,有同於無矣!
舉例而言,一千五百萬字之《全唐文》,其數不能算多,「假定」字全碼全,且假定每字兩碼,欲從其中檢索:「丘之小不能一畝」七字,其條件可能全同或三、四、五字相同,欲知最初出自何人﹖何書﹖以及何人引用﹖何人抄襲﹖
若無字序,一般系統檢索需時數日,甚或數月,故皆視若畏途(欒教授之經驗,最長一次為四十一天﹚。如此一來,未經查證之文史資料,粗製濫造,以訛傳訛,文化怎能不成廢墟﹖
用老朽之系統,每查一字,平均僅需十個指令即足,總共一億千萬指令完成任務。如以當今500MIPS之系統,還不到一秒鐘!再若改用「算盤基因」之技術(可用理解概念搜尋﹚,預計僅需千分之一秒(屆時歡迎挑戰﹚!
至於中文2000部份,網絡平台將於本月底峻工(電腦系統平台勢將順延,蓋此平台必須符合前述新開CPU之規格,否則本公司之系統亦將「一國兩制」矣﹚,可望於九月初,與網絡、資料庫、電書同時推出。
由於網友留言踴躍,老朽甫歸,工作堆積如山,只得擇其要者,統一簡答如次:
敬謝網友鼓勵,三年之內,中華必興,老朽且預言於此(恕不接受「質詢」﹚。
同時感謝廣大之投資股友,股票升跌,原係市場常態。本次全球股市狂瀉,實因「網絡泡沫」過度高沽,終於進入「實質重整」之故。本企業集團財務健全(有公證為憑﹚,目前「寂寂不動」,係因正全力投入各項已公佈、及多項尚未公佈之重大工程中(其所以未公佈者,是值此「東西文化聖戰」中,斥候交接,不宜「打草驚蛇」也﹚。
所可告者,老朽雖無能無德,但「人心思漢」,在「漢文化資訊」之巨纛下,各方力量涓聚成流,所有困難皆迎刃而解,大業必成也。
老朽所創之基金有二,一為「倉頡基金」,人不能忘本,當有以報之。二為「漢文化資訊基金」,用以繼續發展各項非商業之未竟工程。由於目前各項工作千頭萬緒,我等人手有限,無暇兼顧,擬待大局底定之後,再落實之(盛情敬領﹚。
有網友關心「行銷團隊」,基於「中華文化」之精神,本企業集團堅持有利共享的原則,大部份之產品,率皆「技術公開」,由業界自行生產行銷。本集團負責提供CPU、介面規格、網站服務等,已有千百倍之利益。若以中國市場而論,數以億計的各種產品,豈可任少數人獨霸﹖蓋茲之「富」,未必為「福」,貪多是苦也。
欲知「通往明燈之方向」,須知「一燈見形,百燈見光」。若方向為「一」,堅持執著,遲早可達﹔若方向有二,達一則失一,更何況三、四﹖再若欲知「正確之方向」,其答案即「唯一之方向」。「一」者「人」也,人各不同,人生之使命、任務有別,問人不如問己:「做什麼能令自己問心無愧﹖」無愧者,自己之方向也﹔無愧者,明燈也。
韓非子強調法治,法治者技術也,源於黃老而用於治人,是理之末矣。
中華文化之四維:「史實、地情、道德、民俗」,中醫者,民俗技藝也。四維既張,中醫必將大興,無足為慮也。祝由十三科亦屬民俗,所不同者,其法不正,循私者多,利眾者少(正者,止於一,一者眾利也﹚,不宜多研。
「偽君子」者,「無能而好名」之人也,其貌類君子,其行如小人。人間本為一場場相接之戲目,生旦淨末丑,缺一不可。演戲之人,理應戮力演出,若係看戲之觀眾,大可安坐板凳之上,欣之賞之。偽君子鼻梁塗白,能搏一粲,足矣!
老朽若不能實現對大眾之承諾,亦偽君子也。
當今中華文化儼然廢墟,萬廢待舉,非止「易經推廣」一端也。
「傳統建築」涉及空間與環境的依存關係,得失已見,尚須從長計較也。
速讀未若熟讀,用心為上。
欲學「漢字基因」,可先由本網若干文下手,待有興趣,試查《漢字基因字典》,自必大有斬獲。預計明年,老朽當撰《漢字門階》一書,以饗學者。
舊 23 留言者:網主 [1998-12-12]
告網友:
  電書設計已妥,但因涉及採購及與協力廠商間的互動關係,目前始開始正式測試。
茲將細部進度表公佈於「漢文化資訊」欄,進度項中,若有變更將另行公佈。
舊 25 留言者:網主 [1998-12-12]
告網友:
  今日敝網無戰事,承蒙網友配合,「算盤基因」果無人再問。老朽心有難安,老骨頭也閒散不得,特再舉一實例,將我等正在設計之硬體方案,與網友共享。
  我國淪落至今,非缺人材,實乃人人謀己,力量分散所致。「文傳」自宣佈電書計劃以來,姑不論褒貶,卻已深得人心。近日來,數件「求之而不得」、「驚天地而泣鬼神」且具有「劃時代」的「瑰寶」,一一自動找上門來,真可謂「水到渠成」。
  「算盤基因」僅其中之一,此外尚有「天羅地網」(請恕不能暢言﹚,今年九月將會掀起一波完全由國人主宰的「資訊革命」。如果老朽錯了,各位不妨當作「唐吉訶德」大戰「風車」的新一章,至少,也算是「先睹為快」吧!
  先介紹一件意外的事,北京的欒貴明教授,他在整理「全唐宋詩文」時,用「多層次交叉索引」,竟然發現老朽所崇拜的詞人李清照,詩人歐陽修等,其詩詞多係抄自前人!「天下文章一大抄」,未料大師們也不例外!
  這是因為欒教授在十年前就認定:倉頡字母的「字序」功能威力無比。他堅持採用「倉頡內碼」,字序一貫,碼多且全。十年來,他從先秦到近清的各種古文資料一概建檔,並一一交叉檢索,把所有的謬誤、殘缺、重複列舉出來,正本清源。
  此工程之浩大,內容之完整,勘校之仔細,可稱空前。正是因為欒教授這項傲人的成就,老朽有恃無恐,才敢斗膽提出「漢文化資訊聯盟」及「中文電書」的構想。
  由於資料量越來越大(已有近百億筆資料﹚,用軟體程式檢索效益有限,老朽決定將此「資料索引」之功能,設計在下一代的CPU中。正好「算盤基因」技術適時出現,其指標完全符合要求,果真可行,功效將提高萬倍以上。
  此乃文化工具,應屬全民所有,老朽十餘年前就已將此觀念公開(只是無人相信有此需要﹚,是以無涉「商機」。算盤基因是炎黃遺產,理應將之發揚光大(唯因某種原因,尚須略候﹚,以期號召有志同胞,共襄盛舉。

  算盤基因CPU之指令設計方案,雙索引、多層動態資料索引:
  將原始資料建為「數碼資料」,採用「倉頡內碼」(每字四字元,字母排序﹚。此資料檔以各書之行次為索引,定名為「行次索引檔」。
  從「行次索引檔」將資料取出,再建「字碼索引檔」。本以「倉頡字碼」為基層,「行次記錄」為上層,如有必要,尚可建頁次、章節、書目、分類等索引於其上。
一、行次索引
  1,行次索引檔之內碼結構:(以位元表示﹚
    每字有倉頡碼五碼,每碼各取五位元,共二十五位元,內碼分配如下:
    第一字元:x1x2x3x4x5x6x7x8
         x1=1 倉頡碼=0 ASCII 碼
         x2=1 繁體碼
         x3=1 簡體碼
         x4x5x6x7x8倉頡第一字母
    第二字元:x1x2x3x4x5x6x7x8
         x1x2x3其他漢字如日文、韓文等
         x4x5x6x7x8倉頡第二字母
    第三字元:x1x2x3x4x5x6x7x8
         x1保留
         x2x3x4x5x6倉頡第三字母
         x7x8倉頡第四字母之首二位元
    第四字元:x1x2x3x4x5x6x7x8
         x1x2x3倉頡第四字母之後三位元
         x4x5x6x7x8倉頡第五字母
      註:上述第三、四字元,其內容即後述之「對照碼」。
  2,行次索引檔之行次記錄:
    以各書之頁數為準,各頁有行。頁數與行數合「頁碼」。
      ppppppppxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
    以四字元逐行記錄之,其後即為內碼。
二、字碼索引
  倉頡字碼檔(以字元表示﹚
    倉頡字母二十六個,每字五碼。各碼一律僅取後五位元。取前二字母之序值作為
  索引值,後三碼壓縮為十五位元「對照碼」(請見前註﹚。
    各書索引置放於「索引區」,對照碼置於於「資料區」。
    索引區之資料結構為:
        ZZZZZZZZZ四字元=記憶區位
    資料區之結構為(單位為字元﹚:
        XXTTPPPPPPPP
          XX為對照碼
          TT為本筆資料總長度
          PP為頁碼
三、指令設計:以下指令皆以﹝ ﹞括之
  利用「算盤基因」之硬體,以邏輯閘所組成之「宏指令」實現下述之各種功能:
    ﹝倉頡字碼﹞:每字母僅取後五位元。
      前二字母之序值作為「索引值」,採26進位,供檢索對照碼用。
      後三碼壓縮為十五位元「對照碼」,置於資料區,供檢索行碼用。
    ﹝字碼建檔 甲,乙﹞:
      甲=原始檔(指各書之行次索引檔﹚
      乙=字碼索引檔名
      處理流程:
        將甲檔調出,設定記憶體範圍。
        由檔中順序取出「字碼」,用第一、二碼建或查索引,以三、四、五碼
      所壓縮之「對照碼」比對索引所指之資料區。
        如有該碼,則記下行次。
        如無,則記下該碼、行次,並調整長度。
        至全部資料處理完畢。
    ﹝資料檢索 甲,乙,丙,丁,XXX…XXX﹞
        甲=行索引檔名
        乙=字碼索引檔名
        丙=檢索範圍,指每字可能偏移的位數。
          如丙=0 可免寫,表示每字無誤差。
           丙=2 每字容許二字誤差
            如查「容許」,「容XX許」亦算有效。
        丁=輸出之格式檔(由軟體定義之﹚
        XX…XX=檢索之字串
      處理流程:
        將甲檔調出。設定操作記憶體範圍。
        用欲檢索之字串查「字碼索引檔」得行數。
        由「行索引檔」依檢索範圍比對其他「字串」。
          如有,依丁記錄之。
          否則,再查。
        全部查完否﹖
          如否,繼續。
          完成。
四、多功處理
  因係硬體,速度極快。且利用算盤基因,可同時以多重「算柱」,交互進行。
  在理論上,如果設計妥當,「雙索引、多層動態」應構成一「整體」,在一個時鐘脈衝下,即可完成一字的檢索。
  以500MIPS 的系統而言,每秒可檢索五億字碼。
  再若以多功交互處理,不僅效率奇高,幾可與人類思維之網狀方式相比擬。
  若是,誰敢說漢字落伍﹖
舊 26 留言者:網主 [1998-12-12]
告網友:
  網友日多,所問者若有重複,老朽當視情況作覆,以節省大家的時間。
又:下月本留言欄即將改型,問於前答在後。老朽每日清晨作答,約九時掛網。
由於本網規模不大,請勿佔用過多篇幅是幸。

本站之資料、著作歡迎網友註明出處後轉載,
但嚴禁以商業行為牟利。
朱邦復工作室