Home நாடு முத்து நெடுமாறன் விளக்கம் : ‘மொழி உருப்படிவம்’ என்றால் என்ன? செல்லினம் சொற்பட்டியல் பயன்படுத்துவது எப்படி?

முத்து நெடுமாறன் விளக்கம் : ‘மொழி உருப்படிவம்’ என்றால் என்ன? செல்லினம் சொற்பட்டியல் பயன்படுத்துவது எப்படி?

1516
0
SHARE
Ad

(மலேசியாவின் தமிழ் வானொலி மின்னல் பண்பலையில் ஞாயிறுதோறும் ஒலியேறிவரும் இலக்கிய நிகழ்ச்சி ‘அமுதே தமிழே’. இன்று 16 ஏப்பிரல் 2023 ஒலியேறிய நிகழ்ச்சியில் கணினித் துறை நிபுணரும் தமிழ் மென்பொருள் முரசு அஞ்சல் உருவாக்குநருமான முத்து நெடுமாறன் வழங்கிய உரை) 

வணக்கம். கடந்த பகிர்வில் விண்டோஸ் 11இன் அண்மைய மேம்பாட்டில், முரசு அஞ்சல் விசைமுகம் (அதாவது Anjal keyboard layout) இயங்குதளத்தோடு சேர்க்கப்பட்ட நற்செய்தியைப் பகிர்ந்தேன். அதனைப் பற்றி விளக்கியபோது, ‘மொழி உருப்படிவம்’ எனும் கலைச்சொல்லைப் பயன்படுத்தினேன். “இதனைச் சற்றுத் தெளிவு படுத்தினால் நன்றாக இருக்குமே ஐயா” என்று நண்பர்கள் பலரும் நேயர்களும் கேட்டிருந்தார்கள்.

கடந்த வாரம், புதிய செல்லினத்தின் பதிப்பில் “உங்கள் சொந்தச் சொற்பட்டியலை உருவாக்கலாம்” எனும் செய்தியையும் வெளியிட்டிருந்தேன். அதுகுறித்தும் விளக்குமாறு சிலர் கேட்டிருந்தனர்.

#TamilSchoolmychoice

இரண்டிற்கும் தொடர்பு உள்ளது என்பதால், முதலில் ‘மொழி உருப்படிவம்’ என்றால் என்ன என்பதனைப் பற்றி இன்னும் சில எடுத்துக்காட்டுகளுடன் தெரிந்து கொள்வோமா?

கணினியிலும் கைப்பேசிகளிலும் தமிழைப் பயன்படுத்த இவற்றை எல்லாம் தெரிந்துகொள்ளவேண்டுமா என்று சிலர் அஞ்சலாம்; அஞ்சவே வேண்டா!

இவற்றைப் பற்றித் தெரிந்து கொள்ளாமலேயே தமிழைக் கணினியிலும் கைப்பேசியிலும் நீங்கள் எளிதாகவே பயன்படுத்தலாம். எனினும் இவற்றைப் பற்றித் தெரிந்து கொண்டோமென்றால், பயன்பாடு இன்னும் மகிழ்ச்சி கலந்ததாக இருக்கும்.

இசையை ரசிப்பதற்கு இசையைப் பற்றித் தெரிந்து கொள்ள வேண்டும் என்ற அவசியம் இல்லை … ஆனால் இசையைப் பற்றிக் கொஞ்சம் தெரிந்தால் அதனை இன்னும் ஆழமாக ரசித்து மகிழலாம் … அல்லவா?

அதுபோலத்தான் நுட்பவியலும். ஓரளவு தெரிந்து கொண்டால் பயன்படுத்துவதில் மேலும் களிப்படையலாம்!

மொழி உருப்படிவம்

சரி … இந்த ‘மொழி உருப்படிவம்’ என்றால் என்ன?

மிக எளிமையாக விளக்கவேண்டும் என்றால் … பயன்படுத்தப்படும் மொழியைப் பற்றிக் கணினிக்கு அதிகமான தகவல்களைக் கொடுக்கும் ஒரு தொகுப்பாகக் கருதலாம்.

இந்த ‘உருப்படிவம்’ பல பயன்பாட்டு நிலைகளைக் கொண்டிருக்கும். தட்டெழுதும்போது (அதாவது type செய்யும்போது) வழங்கும் பரிந்துரைகள் முதல், நாம் கேள்விகளைப் ‘புரிந்து கொண்டு’ அதற்கேற்ற பதில்களைத் தரும் நுட்பம் வரை இந்த உருப்படிவங்களின் நுட்ப அளவு மாறுபட்டிருக்கும்.

மொழிசார்ந்த செய்யறிவுக்கு (அதாவது செயற்கை நுண்ணறிவுக்கு) இந்த மொழி உருப்படிவம் மிகவும் தேவை.

அண்மையில் அதிகமாகப் பேசப்படும் Chat GPT நுட்பத்திற்குப் பயன்படுத்தப்படும் மொழி உருப்படிவம் மிகப் பெரிய ஒன்று. மிகவும் நுட்பமானதும் கூட. இதனை LLM அதாவது Large Language Model என்பார்கள். மொழிக்கான பெரிய உருப்படிவம்.

பெரிய உருப்படிவங்கள் ஒருபுறம் இருக்கட்டும். அவற்றை உருவாக்குவது மிகவும் கடினமான ஒன்று.

இன்று நாம் ஒரு எளிமையான இலக்கணப் பிழைதிருத்தம் தொடர்பான எடுத்துகாட்டைக் கொண்டு இந்த மொழி உருப்படிவத்தின் செயல்பாட்டைப் புரிந்து கொள்ள முயல்வோம்:

அந்த, இந்த, எந்த ஆகிய சொற்களுக்குப் பிறகு க, ச, த, ப எழுத்துகளோடு தொடங்கும் சொல்லாக இருந்தால் வலி மிகும் என்று ஒரு இலக்கண விதி இருக்கிறது. இந்த விதியைக் கணினிக்குள் செலுத்துவது மிக எளிது. வெறும் எழுத்துகளை மட்டுமே கையாண்டு இந்த விதியை நிரலிட்டுவிடலாம் – அதாவது programme செய்துவிடலாம். சொற்களின் பொருளோ அவற்றின் தன்மையோ கணினிக்குத் தெரிய வேண்டியதில்லை. அதனால் இங்கு ‘மொழி உருப்படிவம்’ தேவை இல்லை. எழுத்துகளே போதும்.

வேறோர் எடுத்துக்காட்டைக் காண்போம். நினைவில் வாழும் இறையருட்கவிஞர் ஐயா சீனி நைனா முகமது அவர்களின் புதிய தமிழ்ப்புணர்ச்சி விதிகள் எனும் நூலில் 55ஆம் பக்கத்தில் இதனைக் காணலாம்.

புலவர் காளமேகம் – இதில் புலவர் என்ற சிறப்புப் பெயர் முந்திவந்ததால் வலிமிகவில்லை

காளமேகப் புலவர் – இதில் காளமேகம் என்ற இயற்பெயர் முந்தி வந்ததால் வலி மிகுந்தது –

என்று விளக்கி இருக்கிறார்.

புலவர் காளமேகம் – வலி மிகவில்லை. காளமேகப் புலவர் – வலி மிகுந்திருக்கிறது.

இதில் முன் வரும் சொல் இயற்பெயரா சிறப்புப் பெயரா என்ற விவரம் நமக்குத் தெரியும். ஆனால் கணினிக்குத் தெரியாது அல்லவா? ஒவ்வொரு சொல்லும் தோன்றுமிடத்திற்கு ஏற்றவாறு அவற்றின் பொருளும் தன்மையும் மாறுபடும். இது தமிழுக்கு மட்டுமல்ல எல்லா மொழிகளிலும் காணப்படும் விதிகள்.

இந்தத் தன்மைகளையும் விதிகளையும் அறியாமல் கணினியால் பிழை திருத்தங்களைச் செய்ய முடியாது. இவற்றை முறையாக அமைத்துத் தருவதுதான் மொழி உருப்படிவம்.

ஒரு தொடரில் உள்ள அனைத்துச் சொற்களையும் அலசிப்பார்த்து விதிகளைச் சேர்ப்பதற்கும் பிழைகளைத் திருத்துவதற்கும் மொழி உருப்படிவம் கட்டாயம் தேவை!

செல்லினத்தின் சொற்பட்டியல்

சரி இனி, செல்லினத்தில் உள்ள சொற்பட்டியலுக்கு வருவோம்.

செல்லினத்தின் முதன்மையான வேலை, திறன்கருவிகளில் தமிழில் உள்ளிட, அதாவது தட்டெழுத, நமக்கு உதவுவதே.

தமிழில் உள்ளிடுவது எளிதாக இருக்க வேண்டும். அதே வேளை விரைவாகவும் உள்ளிட உதவ வேண்டும். நாம் எழுத்துகளைத் தட்டத் தட்ட அவற்றை உடனே சொற்களில் சரியாகப் போய்ச் சேர்க்க வேண்டும்.

திறன்கருவிகள் சிறிதானவை. கணினிக்கான விசைப்பலகையில் எல்லா விரல்களையும் கொண்டு எழுதுவதுபோல் திறன்கருவிகளில் நாம் எழுத முடியாது. மேலும் எழுத்துகளுக்கான விசைகள் மிகவும் நெருக்கமாக இருக்கும். ஆகவே, வேகமாகத் தட்டெழுதும் போது, தவறிப் பக்கத்தில் இருக்கும் விசையைத் தட்டுவது இயல்பாக நடக்கும் ஒன்று. இதனால் ஏற்படும் பிழைகளையே ‘தட்டுப்’ பிழை என்கிறோம்.

இதுபோன்ற பிழைகளைத் தவிர்ப்பதற்காக ‘மெதுவாகவே தட்டெழுதுங்கள்’ என்று பயனர்களைக் கட்டுப்படுத்த முடியாது. இந்தப் பிழைகளை, கருவியில் உள்ள செல்லினம் போன்ற உள்ளிடுமுறைகளே தீர்க்க வேண்டும். அதுவும் உடனுக்குடன் தீர்க்க வேண்டும்.

இந்தத்தீர்வுகளுக்கு மிக முக்கியமாகத் தேவைப்படுவது முழுமையான சொற்கள் அடங்கிய பட்டியல். இதுவே செல்லினம் பயன்படுத்தும் மிக எளிமையான ஒரு ‘மொழி உருப்படிவம்’.

தட்டுப் பிழைகளைத் தவிர, வேறெந்த இலக்கணப் பிழைகளைத் தீர்க்கும் செயலை உள்ளிடு முறையில் சேர்ப்பது பொருத்தமாகாது. இலக்கணப் பிழைகளைத் தீர்க்க நேரம் பிடிக்கும்.

நொடிப்பொழுதுக்கும் குறைவான நேரமே ஆனாலும், பயன்பாட்டு அனுபவத்தைப் பாதிக்கும். மேலும் தட்டழுதப்பட்ட முந்தையச் சொல், தட்டெழுதிக் கொண்டிருக்கும் தற்போதைய சொல், இவ்விரண்டு சொற்களில் மட்டுமே உள்ளிடு முறையின் கவனம் இருக்கும். ஒரு முழுத்தொடரையும் கண்காணித்து பிழைகளைத் தீர்த்து வரத் தொடங்கினால், பயன்பாடு மிகவும் மெதுவாகிவிடும். உள்ளிடும் அனுபவத்தைப் பெரிதும் பாதிக்கும்.

எனவே ஒரு சொல்லில் ஏற்படும் தட்டுப்பிழைகளை மட்டும் சரிபடுத்தினாலே, உள்ளிடு முறையின் மிகப்பெரிய வேலை முடிந்ததாகக் கருதலாம்.

எழுத்துகளைத் தட்டத் தட்டச் சொல் உருவாகிறது. உருவாகும் சொல், சேர்க்கப்பட்டிருக்கும் சொற்பட்டியலில் இருந்தால், எந்த மாற்றத்தையும் செல்லினம் செய்யாது. அது சரியான சொல்லே என்று விட்டுவிடும். ஆனால் தட்டெழுதப்படும் சொல் இல்லை என்றால், அதற்கு மிகவும் நெருக்கமான சொல்லை, பட்டியலில் மிகவும் விரைவாகத் தேடி எடுத்து பரிந்துரையில் காட்டிவிடும்.

எடுத்துக்காட்டாக வனக்கம் என்று றன்னகரம் கொண்டு (அதாவது இரண்டு சுழி ன கொண்டு) எழுதினால், செல்லினம் இரண்டு முடிவுகளை எடுக்கும் முதலாவது ‘வனக்கம்’ எனும் சொல் பட்டியலில் இல்லை என்பதை உறுதிப்படுத்திவிடும். அடுத்தது அதற்கு நெருக்கமான சொல்லாக வணக்கம் எனும் சொல்லை தேர்ந்தெடுத்துவிடும்.

எப்படி நெருக்கமான சொல் என்று தெரிந்து கொள்கிறது என்பதற்கு சில விதிகள் உள்ளன. இந்த விதிகள் அந்தச் சொல்லில் உள்ள எழுத்துகளைக் கொண்டே கணித்துவிட உதவிடும்.

செல்லினத்தில் 5 இலட்சத்திற்கும் மேற்பட்ட சொற்கள் பட்டியலில் உள்ளன. சொற்கள் மட்டும் அல்லாமல், இந்த மொழி உருப்படிவத்தில் ஒவ்வொரு சொல்லுக்கும் அடுத்துவரும் பெரும்பான்மையான சொற்களும் சேர்க்கப்பட்டுள்ளன.

இந்த உருப்படிவத்தைக்கொண்டே திருக்குறள், ஆத்திசூடி, கொன்றைவேந்தன், பழமொழிகள் முதலானவற்றைச் செல்லினம் கணிக்கிறது. “யாதானும்” என்று முதல் சொல்லை எழுதினால் போதும், “யாதானும் நாடாமால் ஊராமால் என்னொருவன் சாந்துணையுங் கல்லாத வாறு” என்று இந்தக் குறளில் அடுத்தடுத்து வரும் சொற்களை உடனுக்குடன் கணித்துக் கொடுக்கிறது.

இந்தச் சொற்களுக்கப்பால், நமது அன்றாடப் பயன்பாட்டில் பல தனிப்பட்ட சொற்களைப் பயன்படுத்தும் தேவை கட்டாயம் உள்ளது. சில வேளைகளில் மலாய், சீன, ஆங்கில மொழிச் சொற்களையும், பெயர்களையும் தமிழ் எழுத்துகளில் அடிக்கடி எழுதுவதற்கானத் தேவை ஏற்படும். இந்தச் சொற்கள் எல்லாவற்றையும் செல்லினத்தின் சொற்பட்டியலில் சேர்க இயலாது. அவ்வாறு சேர்த்தால் செயலியின் அளவு மிகப் பெரிதாகிவிடும். கைப்பேசியில் அடங்காமலும் போய்விடும்.

இதற்காகத்தான் பயனர்கள் தங்களின் சொந்தப் பயன்பாட்டிற்கான சொற்களை, அவரவர் சொந்த சொற்பட்டியலில் சேர்த்துகொள்ளும் வாய்ப்பை புதிய செல்லினத்தில் சேர்த்துள்ளோம். சொற்கள் சேர்க்கப்பட்டவுடன், அவை மற்ற சொற்களோடு இணைந்து பரிந்துரைகளிலும் பிழைத்திருத்தங்களிலும் ஈடுபடும். செல்லினம் சொற்பட்டியலுக்கு வழங்கும் எல்லா வசதிகளையும் தனிப்பட்ட சொற்பட்டியலுக்கும் வழங்கும். தனிபட்ட சொற்பட்டியல் உங்கள் திறன்பேசிக்குள் மட்டுமே இருக்கும் – தனிப்பட்ட சொற்பட்டியல் என்றால் அவ்வாறு தானே இருக்க வேண்டும்?

மொழி உருப்படிவம் பற்றியும் சொற்பட்டியல் பற்றியும் இந்த விளக்கம் தெளிவு படுத்தி இருக்கும் என நம்புகிறேன்.

(குறிப்பு: மேற்கண்ட உரையை ஒலி வடிவில் கீழ்க்காணும் இணைப்பில் கேட்டு மகிழலாம்)

https://www.facebook.com/muthu.nedumaran/videos/738779604643709