Wednesday, May 6, 2020

History of Unicode




Unicode's origins began in 1987, with the use of Xerox character code (XCCS), and the practicality of creating a universal character set with Joe Becker at Xerox with Lee Collins and Apple's Mark Davis. In August 1988, with the additional input of Peter Fenwick and Dave Opstad, Joe Becker published a draft proposal for an international / multilingual text encoding called "Unicode". He explained that the name "Unicode" was intended to suggest a unique, integrated, universal coding.

Becker cited a 16-bit format in this document called Unicode 88

Unicode aims to meet the need for reliable, world class coding that can work. Unicode can be roughly referred to as "wide body ASCII" and it can extend up to 16 bits to include characters in all living languages ​​in the world. In a properly designed layout, 16 bits per character is not enough
His original 16 bit design was based on the assumption that only modern scripts and fonts would be required to be encoded.

Unicode places a high priority on ensuring usability for the future rather than preserving past antiquities. Unicode aims at first publishing characters in modern manuscripts (eg, all the newspapers and magazines printed in the world in 1988), much less than 214 = 16,384. Beyond modern-use characters, everything else can be defined as obsolete or rare; These are better candidates for registering personal use than forming a public list of commonly used Unicodes.

In early 1989, the Unicode Working Group was expanded by Ken Whistler and Mike Carnagan of Metaphor, Karen Smith-Yoshimura of RLG, and Joan Alliprand of Glenn Wright of Sun Microsystems, and Rick McGowan of Microsoft and NeXT in 1990. By the end of the 1990s, much work on mapping existing character coding standards had been completed and a final review draft of Unicode was ready.

The Unicode Convention was incorporated in California on January 3, 1991, and in October 1991 the first volume of the Unicode Standard was published. The second volume, covering Han ideology, was published in June 1992.

In 1996, Unicode 2.0 implemented a substitute character script, which allowed Unicode to no longer be limited to 16 bits.

This increased the Unicode code space to more than one million code points, allowing for the encoding of many historical scripts (eg Egyptian hieroglyphs) and thousands of rarely used or obsolete characters that were not expected to be encoded. Unicode characters, originally intended for kanji or Chinese characters, are often used as part of private and place-names and are rarely used, but are more essential than Unicode's original architecture.
Since 1992, Microsoft has used the Apple Unicode name in place of the Unicode for the Microsoft TypeType Specification Version 1.0 naming table platform platform.

----------------------------------------------------------------------------------------------

ඉතිහාසය
1980 සිට සෙරොක්ස් අක්ෂර කේත ප්රමිතිය (XCCS) සමඟ ඇති අත්දැකීම් මත පදනම්ව, යුනිකෝඩ් වල මූලාරම්භය 1987 දක්වා, සෙරොක්ස් හි ජෝ බෙකර් සමඟ ලී කොලින්ස් සහ ඇපල්හි මාක් ඩේවිස් සමඟ විශ්ව චරිත කට්ටලයක් නිර්මාණය කිරීමේ ප්රායෝගිකභාවය සොයා බැලීමට පටන් ගත්හ. පීටර් ෆෙන්වික් සහ ඩේව් ඔප්ස්ටැඩ්ගේ අතිරේක ආදානය සමඟ, ජෝ බෙකර් 1988 අගෝස්තු මාසයේදී "යුනිකෝඩ් ලෙස තාවකාලිකව හැඳින්වෙන" අන්තර්ජාතික / බහුභාෂා පෙළ අක්ෂර කේතන ක්රමයක් සඳහා කෙටුම්පත් යෝජනාවක් ප්රකාශයට පත් කළේය. "යුනිකෝඩ්" යන නම අද්විතීය, ඒකාබද්ධ, විශ්වීය කේතීකරණයක් යෝජනා කිරීමට අදහස් කරන බව ඔහු පැහැදිලි කළේය.

යුනිකෝඩ් 88 ලෙස නම් කර ඇති මෙම ලේඛනයේ බෙකර් විසින් බිටු 16 අක්ෂර ආකෘතියක් ගෙනහැර දැක්වීය

යුනිකෝඩ් හි අරමුණ වන්නේ වැඩ කළ හැකි, විශ්වාසදායක ලෝක පෙළ කේතීකරණයේ අවශ්යතාවය සපුරාලීමයි. යුනිකෝඩ් දළ වශයෙන් "පුළුල් ශරීර ASCII" ලෙස හැඳින්විය හැකි අතර එය ලොව සියලුම ජීවමාන භාෂාවල අක්ෂර ඇතුළත් කිරීම සඳහා බිටු 16 ක් දක්වා විහිදේ. නිසි ලෙස සැලසුම් කරන ලද සැලසුමක දී, අක්ෂරයකට බිටු 16 ක් මේ සඳහා ප්රමාණවත් නොවේ
ඔහුගේ මුල් බිට් 16 නිර්මාණය පදනම් වී ඇත්තේ නවීන භාවිතයේ ඇති ස්ක්රිප්ට් සහ අක්ෂර පමණක් කේතනය කිරීමට අවශ් වනු ඇතැයි යන උපකල්පනය මත

අතීත පුරාවස්තු සංරක්ෂණයට වඩා අනාගතය සඳහා උපයෝගීතාව සහතික කිරීමට යුනිකෝඩ් ඉහළ ප්රමුඛතාවයක් ලබා දෙයි. යුනිකෝඩ් අරමුණු කරන්නේ පළමු වරට නූතන පිටපත්වල ප්රකාශයට පත් කරන ලද අක්ෂර (උදා: 1988 දී ලොව මුද්රණය කරන ලද සියලුම පුවත්පත් සහ සඟරා වල එකතුවෙනි), ඒවායේ සංඛ්යාව 214 = 16,384 වඩා බෙහෙවින් අඩු . නවීන භාවිත අක්ෂරවලින් ඔබ්බට, අනෙක් සියල්ලම යල් පැන ගිය හෝ දුර්ලභ යැයි අර්ථ දැක්විය හැකිය; පොදුවේ ප්රයෝජනවත් යුනිකෝඩ් වල පොදු ලැයිස්තුව සැකසීමට වඩා පුද්ගලික භාවිතය ලියාපදිංචි කිරීම සඳහා මේවා හොඳ අපේක්ෂකයින් වේ.

1989 මුල් භාගයේදී යුනිකෝඩ් ක්රියාකාරී කණ්ඩායම පුළුල් කරන ලද්දේ මෙටාෆෝර් හි කෙන් විස්ලර් සහ මයික් කර්නාගන්, ආර්එල්ජී හි කැරන් ස්මිත්-යොෂිමුරා සහ ජොආන් අලිප්රන්ඩ් සහ සන් මයික්රො සිස්ටම්ස් හි ග්ලෙන් රයිට් සහ 1990 දී මයික්රොසොෆ්ට් සහ රික් මැක්ගොවන් NeXT හි කණ්ඩායමට එක්විය. 1990 අවසානය වන විට, පවතින අක්ෂර කේතීකරණ ප්රමිතීන් සිතියම් ගත කිරීමේ බොහෝ වැඩ කටයුතු අවසන් කර ඇති අතර යුනිකෝඩ් හි අවසාන සමාලෝචන කෙටුම්පතක් සූදානම් විය.

යුනිකෝඩ් සම්මේලනය කැලිෆෝනියාවේ 1991 ජනවාරි 3 වන දින සංස්ථාගත කරන ලදී,සහ 1991 ඔක්තෝම්බර් මාසයේදී යුනිකෝඩ් ප්රමිතියේ පළමු වෙළුම ප්රකාශයට පත් කරන ලදී. හැන් මතවාද ආවරණය වන දෙවන වෙළුම 1992 ජුනි මාසයේදී ප්රකාශයට පත් කරන ලදී.

1996 දී යුනිකෝඩ් 2.0 හි ආදේශක අක්ෂර යාන්ත්රණයක් ක්රියාත්මක කරන ලද අතර එමඟින් යුනිකෝඩ් තවදුරටත් බිටු 16 කට සීමා නොවීය.

මෙය යුනිකෝඩ් කේත අවකාශය මිලියනයකට අධික කේත ලක්ෂ්යයක් දක්වා වැඩි කළ අතර එමඟින් බොහෝ ඉතිහාසික පිටපත් (උදා: ඊජිප්තු හයිරොග්ලිෆ්) කේතනය කිරීමට ඉඩ ලබා දී ඇති අතර කේතීකරණ අවශ් යැයි අපේක්ෂා නොකළ කලාතුරකින් භාවිතා කරන ලද හෝ යල්පැනගිය අක්ෂර දහස් ගණනක් විය. යුනිකෝඩ් සඳහා මුලින් අදහස් නොකළ අක්ෂර අතර කලාතුරකින් භාවිතා වන කන්ජි හෝ චීන අක්ෂර භාවිතා වන අතර ඒවායින් බොහොමයක් පුද්ගලික හා ස්ථාන නාමවල කොටසක් වන අතර ඒවා කලාතුරකින් භාවිතා වන නමුත් යුනිකෝඩ් හි මුල් ගෘහ නිර්මාණ ශිල්පයට වඩා අත්යවශ් වේ.
1992 සිට මයික්රොසොෆ්ට් ටෘ ටයිප් පිරිවිතර අනුවාදය 1.0 නම් කිරීමේ වගුවේ වේදිකා හැඳුනුම්පත සඳහා යුනිකෝඩ් වෙනුවට ඇපල් යුනිකෝඩ් යන නම භාවිතා කළේය.

2 comments:

Thank you for you comment