Thursday, October 02, 2008

കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌സ്‌

ഒരു മേഖലയില്‍നിന്നും വിവരസാങ്കേതികവിദ്യയെ ഒഴിവാക്കി നിര്‍ത്താനാവില്ല. അതുപോലെത്തന്നെയാണ്‌ ഏത്‌ വിഷയം പഠിച്ചവരെയും ഐടി ജോലികളില്‍നിന്ന്‌ ഒഴിവാക്കാനാകില്ല എന്ന സത്യവും. സാധാരണഗതിയില്‍ ഭാഷാവിഷയങ്ങള്‍ക്ക്‌ ആകര്‍ഷത കുറഞ്ഞുവരുന്ന ഈ കാലഘട്ടത്തില്‍ ഈ വിഷയത്തില്‍ അതീവ താല്‌പര്യമുള്ളവര്‍ക്ക്‌ തൊഴില്‍ജാലകം മലര്‍ക്കെ തുറന്നുകിടക്കുകയാണ്‌. കമ്പ്യൂട്ടറിനെയും ഭാഷയെയും പ്രണയിക്കുന്നവര്‍ക്ക്‌ മൈക്രോസോഫ്‌റ്റ്‌, ഗൂഗിള്‍ പോലുള്ള വന്‍കമ്പനികളില്‍ തുടങ്ങി നാട്ടിന്‍പ്രദേശത്തെ ചെറുകിട സോഫ്‌റ്റ്‌വെയര്‍ വികസന കേന്ദ്രത്തില്‍ വരെ അവസരങ്ങള്‍ കാത്തുനില്‍ക്കുന്നു.

കമ്പ്യൂട്ടര്‍, ഇംഗ്ലീഷ്‌ വശമുള്ളവര്‍ക്ക്‌ മാത്രമുള്ളതാണന്ന ധാരണ പൊളിച്ചടുക്കിക്കൊണ്ടിരിക്കുന്ന ഈ മാറ്റം ഗ്ലോക്കലൈസേഷന്‍(global + local = glocalisation) എന്നറിയപ്പെടുന്നു. ഇന്റര്‍നെറ്റിന്റെ ശൈശവകാലത്ത്‌ ഇത്‌ പ്രാദേശികഭാഷകളെ കുഴിച്ചുമൂടും എന്നാണ്‌ ഭയപ്പെട്ടിരുന്നത്‌. എന്നാല്‍ കമ്പ്യൂട്ടര്‍ ഭാഷാശാസ്‌ത്രത്തിന്റെ വളര്‍ച്ച മലയാളം പോലുള്ള ചെറുഭാഷകളെപ്പോലും ആഗോളവിപണിയില്‍ മത്സരസജ്ജമാക്കിക്കഴിഞ്ഞു.

മലയാളം യൂണികോഡ്‌ ഫോണ്ടുകളുടെ വരവോടെ ചാറ്റിംഗും മെയിലും ബ്ലോഗിംഗും ഒക്കെ മലയാളംകൊണ്ടു നിറഞ്ഞത്‌ അവിടെ നിലക്കട്ടെ. മൈക്രോസോഫ്‌റ്റ്‌, ഗൂഗിള്‍ തുടങ്ങിയ ആഗോള സ്ഥാപനങ്ങളും മലയാളം പതിപ്പുകള്‍ തുടങ്ങിക്കഴിഞ്ഞു. സ്വതന്ത്രസോഫ്‌റ്റ്‌വെയര്‍ സംരംഭങ്ങളുടെ ഇടപെടലാണ്‌ പ്രാദേശികഭാഷാ ഉപകരണങ്ങള്‍ വികസിപ്പിക്കുന്നതില്‍ നിര്‍ണായക മാറ്റങ്ങള്‍ക്ക്‌ വഴിവെച്ചത്‌. ഗ്നു/ലിനക്‌സ്‌ മലയാളം ഓപ്പറേറ്റിംഗ്‌ സിസ്റ്റം കമ്പ്യൂട്ടറിനെ മൊത്തത്തില്‍ത്തന്നെ മലയാളിക്കിക്കഴിഞ്ഞുവല്ലോ.

എന്താണ്‌ കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌സ്‌?
ഭാഷയെ കമ്പ്യൂട്ടര്‍ അധിഷ്‌ഠിത ഉപകരണങ്ങള്‍ക്ക്‌ പ്രാപ്‌തമാക്കുന്ന ഉത്തരവാദിത്വമാണ്‌ കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌സിനുള്ളത്‌. ഭാഷാശാസ്‌ത്രപഠനത്തില്‍ (MA മലയാളം പോലുള്ള പഠനപദ്ധതികള്‍) സമര്‍ത്ഥരായവര്‍ക്ക്‌ അല്‌പം കമ്പ്യൂട്ടര്‍ പ്രണയം കൂടിയുണ്ടെങ്കില്‍ കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌സ്‌ നന്നായി ഇണങ്ങും. വിവരസാങ്കേതികവിദ്യയുടെ പ്രയോഗങ്ങളെ പ്രാദേശികഭാഷയിലേക്ക്‌ കൂട്ടിയിണക്കി കൂടുതല്‍ ജനങ്ങളിലേക്ക്‌ കമ്പ്യൂട്ടറിനെ എത്തിക്കുകയാണ്‌ ഇവരുടെ ഉത്തരവാദിത്വം. വളരെ ലളിതമായി പറഞ്ഞാല്‍ ഇംഗ്ലീഷ്‌ കീബോര്‍ഡ്‌ ഉപയോഗിച്ച്‌ മലയാളം ടൈപ്പ്‌ ചെയ്യുമ്പോഴും മലയാളത്തില്‍ ചാറ്റ്‌ ചെയ്യുമ്പോഴും മലയാളം വെബ്‌സൈറ്റുകളും ആപ്ലിക്കേഷനുകളും ഉപയോഗിക്കുമ്പോഴും കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌സിന്റെ നേട്ടമാണ്‌ നമുക്കനുഗ്രഹമാകുന്നത്‌. ഇതിന്‌ വിവിധ ഭാഷകളിലെ വാചകഘടന, വ്യാകരണം, അക്ഷരത്തെറ്റ്‌ പരിശോധന എന്നിവയില്‍ ആഴത്തിലുള്ള അറിവ ആവശ്യമുണ്ട്‌.
ഇതുവരെ ഭാഷാപഠനത്തെ ചെറിയൊരു വിഭാഗമെങ്കിലും ജനങ്ങള്‍ താല്‌പര്യപൂര്‍വം സമീപിക്കാത്തതിന്‌ കാരണം ഈ മേഖല വന്‍തുക ശമ്പളമായി നല്‍കാന്‍ പ്രാപ്‌തമല്ല എന്നതായിരുന്നു. എന്നാല്‍ കമ്പ്യൂട്ടറിന്റെ വരവോടെ ഉരുത്തിരിഞ്ഞ കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌സ്‌ തുടക്കക്കാരായ ലിംഗ്വിസ്‌റ്റിക്‌സ്‌ പ്രൊഫഷണലുകള്‍ക്ക്‌ അഞ്ചക്ക ശമ്പളംതന്നെ തുടക്കത്തില്‍ വാഗ്‌ദാനം ചെയ്യുന്നു. ഒപ്പം ഐടി കമ്പനിയുടെ ആകര്‍ഷിപ്പിക്കുന്ന തൊഴില്‍ പരിസരവും. മാത്രമല്ല കേന്ദ്രസര്‍ക്കാര്‍, യുനസ്‌കോ തുടങ്ങിയ ഔദ്യോഗിക ഏജന്‍സികളും വന്‍സ്വകാര്യ കമ്പനികളും പ്രാദേശിക ഭാഷാകമ്പ്യൂട്ടിംഗില്‍ വന്‍തോതില്‍ നിക്ഷേപമിറക്കുന്നുണ്ട്‌. അതുകൊണ്ടുതന്നെ ഈ മേഖല കരിയര്‍ ആയി തിരഞ്ഞെടുക്കുന്നവര്‍ക്ക്‌ സന്തോഷിക്കാന്‍ വകയുണ്ട്‌.
പ്രോഗ്രാമിംഗില്‍ കൂടുതല്‍ താല്‌പര്യമുള്ള ഭാഷാസ്‌നേഹികള്‍ക്ക്‌ ടൈപ്പിംഗ്‌ ടൂളുകള്‍, ഓപ്പറേറ്റിംഗ്‌ സിസ്റ്റം ഡിസൈന്‍, ട്രാന്‍സ്‌്‌ലിറ്ററേഷന്‍ (ലിപ്യന്തരണം), ടെക്‌സ്റ്റ്‌ ടു സ്‌പീച്ച്‌ എന്നിവ വികസിപ്പിക്കുന്ന ടീമില്‍ ചേക്കേറാം. ഫോണ്ടുകള്‍ രൂപകല്‌പന ചെയ്യുന്നതും മറ്റൊരു ആകര്‍ഷക ഐടി ഇടമാണ്‌.

എവിടെ പഠിക്കാം?
ഭാഷാശാസ്‌ത്രത്തില്‍ ബിരുദമോ ബിരുദാനന്തരബിരുദമോ നേടിയശേഷം കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌സില്‍ എത്തുകയായിരിക്കും ഉചിതം. എന്നിരുന്നാലും ഭാഷയില്‍ ആഴത്തില്‍ അറിവുള്ള എഞ്ചിനീയറിംഗ്‌ ബിരുദധാരികള്‍ക്കും MCA ബിരുദധാരികള്‍ക്കും ഈ മേഖല ഇണങ്ങും. സംസാരഭാഷയോട്‌ പ്രതികരിക്കുന്ന ആപ്ലിക്കേഷനുകള്‍ വികസിപ്പിക്കത്തകരീതിയില്‍ ആണ്‌ വിവിധ യൂണിവേഴ്‌സിറ്റികളില്‍ പഠനപദ്ധതികള്‍ വിഭാവനം ചെയ്‌തിരിക്കുന്നത്‌. കമ്പ്യൂട്ടര്‍ ശാസ്‌ത്രത്തിലെ ആര്‍ട്ടിഫിഷ്യല്‍ ഇന്റലിജന്‍സ്‌ (നിര്‍മ്മിതബുദ്ധി) മേഖലയുമായും ഈ പഠനസംവിധാനം ബന്ധപ്പെട്ടിരിക്കുന്നു. കാഴ്‌ചാവൈകല്യമുള്ളവര്‍ക്ക്‌ കമ്പ്യൂട്ടറില്‍ ടൈപ്പ്‌ ചെയ്‌തിരിക്കുന്ന വിവരങ്ങള്‍ വായിച്ചുകേള്‍പ്പിക്കുന്ന സംവിധാനം ഏറെ അനുഗ്രഹമാകുന്നതും ഇതിന്റെ നേട്ടമാണ്‌.
കേരള സര്‍വകലാശാലയില്‍ ലിംഗ്വിസ്റ്റിക്‌സ്‌ പഠനത്തിന്‌ ഏറെ പ്രാധാന്യം നല്‍കുന്നുണ്ട്‌. ഗവേഷണപഠനത്തിനുള്ള സൗകര്യവുമുണ്ട്‌. തിരുവനന്തപുരത്തുള്ള സിഡാക്‌ (C DAC) ഈ മേഖലയില്‍ ഒട്ടേറെ സൗകര്യം ഒരുക്കിക്കഴിഞ്ഞു. ഒപ്പം ഭാഷാ ഉപകരണങ്ങള്‍ വികസിപ്പിച്ചെടുത്ത്‌ പൊതുജനങ്ങള്‍ക്കെത്തിക്കുന്നതില്‍ വ്യാപൃതരുമാണ്‌. കേരള സര്‍ക്കാരിന്റെ ആഭിമുഖ്യത്തിലുള്ള സിഡിറ്റ്‌ (C DIT) മലയാളം ഓഫീസ്‌ പാക്കേജ്‌ തന്നെ വികസിപ്പിച്ചുകഴിഞ്ഞു (www.clickeralam.org).
ആന്ധ്രാപ്രദേശിലെ കുപ്പം എന്ന സ്ഥലത്തുള്ള ദ്രാവിഡ സര്‍വകലാശാല ഇന്ത്യയില്‍ ഈ മേഖലയിലെ ഒട്ടേറെ സംരംഭങ്ങള്‍ക്ക്‌ നേതൃത്വം കൊടുക്കുന്നു. ദക്ഷിണേന്ത്യന്‍ സംസ്ഥാനങ്ങളുടെ സഹകരണത്തോടെ ആരംഭിച്ച ഈ കേന്ദ്രം 1997ലാണ്‌ പ്രവര്‍ത്തനം തുടങ്ങിയത്‌. ഇവിടെ കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌സിന്‌ പ്രത്യേകവകുപ്പുണ്ട്‌ (www.dravidianuniversity.ac.in). ഗവേഷണ സൗകര്യവും ഇവിടെയുണ്ട്‌.
കേന്ദ്രസര്‍ക്കാരിന്റെ മാനവശേഷിവികസന മന്ത്രാലയത്തിന്റെ കീഴില്‍ പ്രവര്‍ത്തിക്കുന്ന സെന്‍ട്രല്‍ ഇന്‍സ്റ്റിറ്റിയൂട്ട്‌ ഓഫ്‌ ഇന്ത്യന്‍ ലാംഗ്വേജസും ഭാരതീയ ഭാഷാസാങ്കേതികവിദ്യയുടെ വികാസത്തിനും വളര്‍ച്ചയ്‌ക്കുമായി രൂപീകരിക്കപ്പെട്ടതാണ്‌. ഹൈദരാബാദ്‌ സര്‍വകലാശാലയുടെ സെന്റര്‍ ഫോര്‍ അപ്ലൈഡ്‌ ലിംഗ്വിസ്റ്റിക്‌സ്‌ ആന്‍ഡ്‌ ട്രാന്‍സ്‌്‌ലേഷന്‍ സ്റ്റഡീസിന്റെ ശ്രദ്ധ ലാംഗ്വേജ്‌ ഇന്റര്‍ഫേസ്‌ രൂപപ്പെടുത്തുന്ന തരത്തിലുള്ള പഠനപദ്ധതികളാണ്‌. ഹൈദരാബാദിലെ തന്നെ ഇന്ത്യന്‍ ഇന്‍സ്റ്റിറ്റിയൂട്ട്‌ ഓഫ്‌ ഇന്‍ഫര്‍മേഷന്‍ ടെക്‌നോളജി കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌സില്‍ M.Tech പ്രോഗ്രാം ഒരുക്കിയിട്ടുണ്ട്‌.
ഭാഷാശാസ്‌ത്രപഠനവും കമ്പ്യൂട്ടര്‍ സാങ്കേതികവിദ്യയും സന്നിവേശിപ്പിക്കുന്ന പഠനപദ്ധതികള്‍ ഇപ്പോഴും മിക്ക സര്‍വകലാശാലകളുടെയും പരിഗണനയിലാണ്‌. താമസിയാതെത്തന്നെ മലയാളം, ഇംഗ്ലീഷ്‌ പഠനവകുപ്പുകളിലും കമ്പ്യൂട്ടറും അനുബന്ധ ഉപകരണങ്ങളും ഇടംപിടിക്കും.

എവിടെയാകും തൊഴില്‍?
നേരത്തെ സൂചിപ്പിച്ചതുപോലെ ഗൂഗിള്‍, മൈക്രോസോഫ്‌റ്റ്‌, യാഹൂ എന്നിവ പ്രാദേശിക ഭാഷയില്‍ പ്രവര്‍ത്തിക്കുന്ന സോഫ്‌റ്റ്‌വെയര്‍ ആപ്ലിക്കേഷനുകള്‍ രൂപകല്‌പന ചെയ്യുന്ന പദ്ധതികള്‍ തുടങ്ങിക്കഴിഞ്ഞു. ഗൂഗിള്‍ മലയാളം യൂണികോഡ്‌ ഫോണ്ട്‌ ഉപയോഗിച്ചുള്ള സെര്‍ച്ചിംഗ്‌, ലിപ്യന്തരണം എന്നിവ കൊണ്ടുവന്നുകഴിഞ്ഞു. മൈക്രോസോഫ്‌റ്റാകട്ടെ www.bhashaindia.com എന്ന പോര്‍ട്ടല്‍ സജ്ജമാക്കി പ്രാദേശിക ഭാഷാപാക്കേജുകള്‍ എത്തിക്കാന്‍ പദ്ധതി തുടങ്ങിയിരിക്കുന്നു. മിക്ക പോര്‍ട്ടലുകളും വിവിധ ഭാരതീയ ഭാഷകളിലേക്ക്‌ ചുവടുമാറിക്കൊണ്ടിരിക്കുകയാണ്‌. ഇത്തരം സ്ഥാപനങ്ങള്‍ക്കൊപ്പം തന്നെ സിഡാക്‌, സിഡിറ്റ്‌ പോലുള്ള സര്‍ക്കാര്‍ നിയന്ത്രിത സ്ഥാപനങ്ങളിലും ഏറെ അവസരങ്ങള്‍ കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌സ്‌ പ്രൊഫഷണലുകളെ കാത്തിരിപ്പുണ്ട്‌. സ്വതന്ത്ര സോഫ്‌റ്റ്‌വെയര്‍ മേഖലയിലാണ്‌ ഒരുപക്ഷേ ഏറ്റവും കൂടുതല്‍ അവസരങ്ങള്‍ ഭാവിയില്‍ ഉണ്ടാകാന്‍ പോകുന്നത്‌.
ലെക്‌സിക്കണ്‍ റിസോഴ്‌സ്‌, ടൂളുകള്‍, അല്‍ഗോരിതം ഉണ്ടാക്കുക, ഭാഷാനിയമങ്ങള്‍ പാലിക്കുന്ന പ്രാദേശിക ടാസ്‌കുകള്‍ ഏറ്റെടുക്കുക എന്നിവയാകും ജോലിയുടെ സ്വഭാവം. ഇതുകൂടാതെ സോഫ്‌റ്റ്‌വെയര്‍ പരിശോധനയും (software testing and validation) ഭാഷാവിദഗ്‌ദരായ കമ്പ്യൂട്ടര്‍ സ്‌നേഹികള്‍ക്ക്‌ ഇടപെടാന്‍ സാധിക്കുന്ന രംഗമാണ്‌.

ഭാവിസാധ്യതകള്‍

ബഹുഭാഷാ നിഘണ്ടു, ഉപകരണ തര്‍ജ്ജമ (Machine translation), ടെക്‌സ്‌റ്റ്‌ ടു സ്‌പീച്ച്‌ എന്നിവ കൂടുതല്‍ കരുത്താര്‍ജ്ജിക്കുമ്പോള്‍ പുതിയ കുറേയേറെ അവസരങ്ങള്‍ കൂടി കരഗതമാകും. മൊബൈല്‍ ഫോണിന്‌ ഉപയോഗിക്കുന്ന ആളിന്റെ ശബ്ദത്തിന്‌ അനുസരിച്ച്‌ ഇപ്പോള്‍ത്തന്നെ നിര്‍ദേശങ്ങള്‍ നടപ്പാക്കുന്നുണ്ടല്ലോ. ഇത്‌ കൂടുതല്‍ മൂല്യവര്‍ദ്ധിത പ്രയോഗങ്ങള്‍ ആകാനും മൊബൈല്‍ ഫോണ്‍ അധിഷ്‌ഠിത ലിംഗ്വിസ്‌റ്റിക്‌ ആപ്ലിക്കേഷനുകള്‍ വ്യാപകമാകാനും സാധ്യത വളരെ കൂടുതലാണ്‌. ആത്യന്തിക ലക്ഷ്യം കമ്പ്യൂട്ടര്‍ അഥവാ ഇതിനായി സജ്ജമാക്കിയ പ്രത്യേക ഉപകരണം ഉപയോഗിച്ച്‌ വിവിധ ഭാഷകള്‍ക്കിടയില്‍ നിമിഷനേരംകൊണ്ട്‌ സാധ്യമാക്കുന്ന മൊഴിമാറ്റം/തര്‍ജ്ജമ തന്നെയാണ്‌. ഇന്ത്യയുടെ നാനാത്വം ഭാഷാപരമായി ഏറെ പ്രത്യേകതകളുള്ളതിനാല്‍ പ്രാദേശികമായി ആകും ഈ തൊഴിലുകള്‍ സൃഷ്ടിക്കപ്പെടുന്നത്‌. അതിനാല്‍ കമ്പ്യൂട്ടേഷണല്‍ ലിംഗ്വിസ്റ്റിക്‌ പ്രൊഫഷണലുകള്‍ക്ക്‌ നാട്ടില്‍ത്തന്നെ ജോലിയും ചെയ്യാം.

*******