Wednesday, May 6, 2020

Origin and development (මූලාරම්භය සහ සංවර්ධනය)


Unicode has a clear purpose of overcoming the limitations of traditional character coding, which is defined by the ISO / IEC 8859 standard, which is widely used in many countries around the world but is largely incompatible. Most traditional scripts are a common problem that allows bilingual computers (usually using Latin fonts and native scripts), but not multilingual computer processing (arbitrary scripted computer combinations with each other).


Unicode, as intended, encodes units such as Glyphus, Glyphus, and Grapheme, which are underlying characters, rather than Glyphus (rendering). In the case of Chinese characters, this sometimes leads to controversy over the distinguishing of the underlying character from its variable glyphs.


In text processing, Unicode plays the role of giving each character a unique code point - a number, not a glyphus. In other words, the Unicode character is represented in an abstract way and the visual rendering (size, shape, font or style) is placed on other software such as a web browser or word processor. However, this simple objective is complicated by the relief provided by Unicode's creators in the hope of encouraging more Unicode adoption.

The first code mark 256 is identical to the content of ISO / IEC 8859-1, which translates the existing Western text.

In order to preserve the distinction of using heritage encoding, many of the essentially identical characters are encoded in different code locations, allowing them to be converted to Unicode (and backwards) without losing any information.

For example, the "full width formats" section of code points covers the full duplicate of the Latin alphabet, because the Chinese, Japanese, and Korean (CJK) letters contain two versions of these characters, the "full width" and the normal width that match the width of the CJK characters.


සාම්ප්රදායික චරිත කේතීකරණයේ සීමාවන් ඉක්මවා යාමේ පැහැදිලි අරමුණ යුනිකෝඩ් සතුව ඇත, එනම් ISO/ IEC 8859 ප්රමිතිය මගින් අර්ථ දක්වා ඇති අතර ඒවා ලෝකයේ  විවිධ රටවල පුළුල් භාවිතයක් සොයා ගන්නා නමුත් බොහෝ දුරට එකිනෙකට නොගැලපේ. බොහෝ සාම්ප්රදායික අක්ෂර කේතන ක්රම ද්විභාෂා පරිගණක සැකසීමට (සාමාන්යයෙන් ලතින් අක්ෂර සහ දේශීය ස්ක්රිප්ට් භාවිතා කිරීමට) ඉඩ ලබා දෙන පොදු ගැටළුවක් වන නමුත් බහුභාෂා පරිගණක සැකසුම් (එකිනෙකා සමඟ මිශ් අත්තනෝමතික ස්ක්රිප්ට් පරිගණක සැකසුම්) නොවේ.

යුනිකෝඩ්, අභිප්රාය අනුව, එවැනි අක්ෂර සඳහා විචල්ය (Glyphus) ග්ලයිෆස්  (විදැහුම්කරණයට) වඩා යටින් පවතින අක්ෂර - ග්රැෆීම් (Grapheme) සහ ග්රැෆීම් වැනි ඒකක සංකේතවත් කරයි. චීන අක්ෂර සම්බන්ධයෙන් ගත් කල, මෙය සමහර විට යටින් පවතින චරිතය එහි විචල් ග්ලයිෆස් වලින් වෙන්කර හඳුනා ගැනීම පිළිබඳ මතභේදයන්ට තුඩු දෙයි

පෙළ සැකසීමේදී, යුනිකෝඩ් විසින් එක් එක් අක්ෂර සඳහා අද්විතීය කේත ලක්ෂ්යයක් - අංකයක් මිස ග්ලයිෆස් එකක් ලබා දීමේ කාර්යභාරය ඉටු කරයි. වෙනත් වචන වලින් කිවහොත්, යුනිකෝඩ් චරිතයක් වියුක්ත ආකාරයකින් නිරූපණය කරන අතර දෘශ් විදැහුම්කරණය (ප්රමාණය, හැඩය, අකුරු හෝ ශෛලිය) වෙබ් බ්රව්සරයක් හෝ වචන සකසනයක් වැනි වෙනත් මෘදුකාංග වෙත තබයි. කෙසේවෙතත්, යුනිකෝඩ් වඩාත් වේගයෙන් සම්මත කර ගැනීම දිරිගැන්වීමේ බලාපොරොත්තුවෙන් යුනිකෝඩ් හි නිර්මාණකරුවන් විසින් ලබා දුන් සහන නිසා මෙම සරල අරමුණ සංකීර්ණ වේ.

පළමු කේත ලකුණු 256 ISO / IEC 8859-1 හි අන්තර්ගතයට සමාන වන අතර එමඟින් පවතින බටහිර පෙළ පරිවර්තනය කිරීම සුළුපටු නොවේ.

උරුම කේතන ක්රම භාවිතා කරන වෙනස ආරක්ෂා කර ගැනීම සඳහා අත්යවශ්යයෙන්ම සමාන අක්ෂර බොහෝමයක් විවිධ කේත ස්ථානවල කේතනය කර ඇති අතර එම නිසා කිසිදු තොරතුරක් අහිමි නොවී එම කේතන වලින් යුනිකෝඩ් (සහ පසුපසට) පරිවර්තනය කිරීමට ඉඩ ලබා දේ.

නිදසුනක් ලෙස, කේත ලක්ෂ්යවලපූර්ණ පළල ආකෘතිකොටස ලතින් හෝඩියේ සම්පූර්ණ අනුපිටපතක් ආවරණය කරයි, මන්ද චීන, ජපන් සහ කොරියානු (CJK) අකුරු වල මෙම අක්ෂරවල අනුවාද දෙකක් අඩංගු වන අතර, සීජේකේ අක්ෂරවල පළලට ගැලපෙනපූර්ණ පළලසහ සාමාන් පළල.

4 comments:

Thank you for you comment