“క్షేత్రశీల భాషాశాస్త్రం” అను Field Linguistics – 9 : 12-14 వారాలు

(ఈ సిరీస్ లోని పాత టపాలు ఇక్కడ.)
*********
గత మూడు,నాలుగు వారాలుగా సగం సమయం విద్యార్థుల ప్రాజెక్టులకు పోగా, మిగిలిన సమయం వాక్యాల్లో పదక్రమం (dominant word order) గురించి కొనసాగుతోంది.

– పధానంగా కనబడే క్రమం ఏది?
– పదక్రమం మరీ స్ట్రిక్ట్ గా (ఆంగ్లంలోలా) ఉంటుందా, తెలుగులో లా పదాలు అటూ ఇటూ మార్చినా అర్థాలు మారకుండా ఉండే అవకాశం ఉందా?
– అకర్మక, సకర్మక, ద్వికర్మక క్రియలు ఉన్న వాక్యాల్లో పదక్రమం ఎలా ఉంటుంది?
– సర్వనామాల వాడుక వల్ల క్రమం మారుతుందా?
– లేదు, కాదు, వద్దు ఇలాంటివి చెప్పేటప్పుడు ఆ negation వాక్యంలో ఎక్కడ వస్తుంది?
– ప్రత్యక్ష, పరోక్ష కర్మలు వాక్యంలో ఏ క్రమంలో వస్తాయి?
– గౌణపోటవాక్యము (subordinate clauseకి తెలుగు పదమట!) ఎలా రాస్తారు?
– కర్మణి, కర్తరి వాక్యాలు (passive, active) వాక్యాలు ఎలా రాస్తారు?
ఇలా అనేక ప్రశ్నలను ఏర్పర్చుకుని, వాటికి అనుగుణంగా ఆంగ్లంలో వాక్యాలు సృష్టించి, మా గున్యా భాష మాట్లాడే అమ్మాయిని ప్రశ్నలు అడిగి సమాచారం సేకరించాము.

ఈ వేళకి నాకు నేను చెబుతున్న క్లాసుల్లో పని ఎక్కువవడం, కాంఫరెన్సులకి ఎక్కువ వెళ్ళాల్సి రావడం, ఇవన్నీ కాక కొన్ని వ్యక్తిగత జీవితంలో మార్పులు – వీటి వల్ల ఏదో క్లాసులకి వెళ్ళి వస్తున్నా కానీ, వచ్చాక మళ్ళీ అధ్యయనం చేయడానికి వీలు పడ్డం లేదు. ఇంకో రెండు వారాలే ఉన్నాయి క్లాసులు. ఆ తరువాత కొంచెం వీలు చిక్కుతుందేమో చూడాలి.

Advertisements
Published in: on April 14, 2018 at 3:28 pm  Leave a Comment  
Tags: ,

“క్షేత్రశీల భాషాశాస్త్రం” అను Field Linguistics – 8 : 9-11 వారాలు

(ఈ సిరీస్ లోని పాత టపాలు ఇక్కడ.)
*********

ఎనిమిదో వారంలో మొదలైన ఉపసర్గ-అనుబంధాల చర్చ (preposition/postposition) తొమ్మిదో వారంలోనూ కొనసాగింది. నేను మూడు క్లాసుల్లో రెండు మిస్సయ్యాను – వేరే సమావేశాలకి వెళ్ళాల్సి ఉండి. తరువాత కోర్సు వెబ్సైట్ చూసి, మా అధ్యాపకురాలితో మాట్లాడి (మావి ఎదురెదురు ఆఫీసులు) తెలుసుకున్నదేమిటంటే, గున్యా భాష ఉపసర్గ ప్రధానమైనదా? అనుబంధ ప్రధానమైనదా? అన్న ప్రశ్న అలాగే మిగిలిపోయిందని. నేను లేని క్లాసులో వీళ్ళు మళ్ళీ మరిన్ని ప్రశ్నలడిగి ఈ ప్రశ్నకి జవాబు తెలుసుకునే ప్రయత్నం చేశారు. కానీ, ఆ సేకరించిన వివరాల్లో కూడా ఉపసర్గ అన్న వాదనకి మద్దతుగా కొన్ని, అనుబంధం అన్న వాదనకి మద్దతుగా కొన్నీ వచ్చాయట. అందువల్ల మనకి లభ్యమైనంత సమాచారాన్ని బట్టి ఏదీ నిర్ణయించలేమని నిర్ణయించారు. కనుక, గత పోస్టులో చూసిన మ్యాపు బొమ్మలో ఉన్న No Dominant Order భాష అనుకోవాల్సి వస్తోంది ప్రస్తుతానికి. ఈ గున్యా ఉన్న భాషా కుటుంబంలో ఒక భాష Kayah-Li అటువంటిదే.

పదో వారం వసంతాగమనం సెలవులు (ఏం వసంతమో, సెలవులై, మార్చి ముగుస్తూ ఉండగా ఇవ్వాళ ఇక్కడ మంచు తుఫాను. ఈ టపా రాస్తూ ఉండగా బయట విపరీతంగా మంచు కురొస్తోంది).

పదకొండో వారం లో కూడా నేను మళ్ళీ మొదటి క్లాసు కి వెళ్ళి తక్కిన రెండూ వెళ్ళలేకపోయాను – ఒక కాంఫరెన్సులో ఉండి. కానీ, ఈ వారం ప్రధానంగా విద్యార్థుల కోర్స్ ప్రాజెక్టుల గురించి సాగింది. రాబోయే నెల రోజుల్లో ముఖ్యమైన ఇతర మీటింగులు చాలా ఉన్నందువల్ల గత టపాలో రాసిన నా reduplication ప్రాజెక్టు ఆలోచన వీరమించుకున్నాను నేను. ప్రాజెక్టు వర్కు చేయలేనని, క్లాసులు అటెండై మిగితా చర్చల్లో పాల్గొంటానని చెప్పాను మా అధ్యాపకురాలికి.

ఇక చివరి క్లాసులో చర్చ వాక్యాల్లో పదాల వరుస (word order) మీదకి మళ్ళింది. తెలుగులో క్రియ చివర్లో వస్తే, ఆంగ్లంలో మధ్యలో వస్తుంది. కర్త-కర్మ-క్రియ – వీటిని రకరకాల వరుసల్లో అమరిస్తే, ఆరు రకాల భాషలొస్తాయి (కర్త-కర్మ-క్రియ, కర్త-క్రియ-కర్మ, క్రియ-కర్త-కర్మ, క్రియ-కర్మ-కర్త, కర్మ-కర్త-క్రియ, కర్మ-క్రియ-కర్త) వీటిల్లో కొన్ని మరీ అరుదు, కానీ, మొదట్రెండు రకాలు కోంచెం తరుచుగా చూసే భాషలు. మొదటి రకం ఎక్కువగా కనిపిస్తుందట ప్రపంచ భాషల్లో. ఇది కాక ఇంకా కొన్ని విచిత్ర పద్ధతులు (వాక్యంలో ఉన్న కర్త-కర్మల్లో ఏది పరిమాణంలో పెద్దదైతే అది మొదట్లో వచ్చే భాషలు) కూడా ఉన్నాయి. అన్నట్లు ఇక్కడ మాట్లాడుతున్నది ప్రధానంగా ఏ వరుస? అనే. తెలుగు లాంటి కొన్ని భాషల్లో కొంచెం వరుస మారినా అర్థం మారకపోవచ్చు – dominant word order గురించి చర్చ ఇక్కడ.

ఇప్పటి దాకా చూసినదాన్ని బట్టి పదాల వరుస విషయంలో ఈ భాష ఆంగ్లం లా కర్త-క్రియ-కర్మ పద్ధతిలో ఉన్నట్లు అనిపించింది. శుక్రవారం నాడు మా వాళ్ళు సేకరించిన ఆడియో ఫైళ్ళు ఇంకా నేను వినలేదు (ఇంకా అప్లోడ్ చేయలేదు మా అధ్యాపకురాలు) కాని, వచ్చే వారం క్లాసులో ఈ విషయం నిర్థారించవచ్చని ఆశిస్తున్నాను.

విద్యార్థులు వాళ్ళ ప్రాజెక్టులు మొదలుపెట్టారు కనుక ఇక ఆ ప్రాజెక్టుల కోసం వివరాల సేకరణ ప్రధాన భాగం వహించేలా ఉంది ఇక మా క్లాసుల్లో ఈ మిగిలిన నాలుగైదు వారాల్లో. మొత్తానికి ప్రపంచ భాషల్ని వర్గీకరించడం ఎంత కష్టమో ఇప్పుడు అర్థమవుతోంది. ఒక్కో criteria తో ఒక్కో రకమైన వర్గీకరణ 🙂

Published in: on March 24, 2018 at 7:21 pm  Leave a Comment  
Tags: ,

“క్షేత్రశీల భాషాశాస్త్రం” అను Field Linguistics – 7 : ఎనిమిదో వారం

(ఈ సిరీస్ లోని పాత టపాలు ఇక్కడ.)
*********
గత వారం విశేషణాల చర్చ జరిగాక, ఈవారం ఉపసర్గ (preposition)/అనుబంధ(post position) పదాల గురించి. ఆంగ్లం లో prepositions (in, from వంటివి) వచ్చినట్లు తెలుగులో మనకి విభక్తి ప్రత్యయాలు, మొదలైన post positions వస్తాయి. కొన్ని భాషల్లో పదానికి ముందూ వెనుకా చేరే circumpositions ఉంటాయట. వీటిని అన్నింటిని కలిపి Adpositions అంటారు భాషాశాస్త్రంలో. దానికి సమానార్థక తెలుగుపదం ఏమిటో నాకు తెలియదు. వేమూరి వెంకటేశ్వర రావు గారి “తెలుగులో కొత్తమాటలు” పుస్తకం చదువుతున్నాను. ఆ స్పూర్తితో నేను “కారక ప్రత్యయాలు” (case affixes అని భావము) అందామనుకుంటున్నాను ప్రస్తుతానికి.

మేము “పుస్తకం బల్ల మీద ఉంది, ఆపిల్ సంచిలో ఉంది” వంటి కొన్ని వాక్యాలకి ఆ అమ్మాయి నుండి వివరాలు సేకరించాము, ఈ కారక ప్రత్యయాలను తెలుసుకోవడానికి. అయితే, సేకరించిన వాటిని బట్టి ఒక విచిత్రమైన విషయం గమనించాను. చాలా మటుకు ఉపసర్గలే ఉన్నాయి గాని, ఒకట్రెండూ (in, on) circumpositions లా అనిపించాయి. పదాలా క్రమం మటుకు ఆంగ్లంలో లాగా in the glass తరహా వరుసలో ఉంది. ఈ నా పరిశీలన ఇంకెవరికీ తోచలేదు అనుకోండి, వీటిని postpositionsగా, ఆ ముందొచ్చిన అక్షరం ముందు పదంలో భాగంగా చూశారు. వచ్చేవారం తెలుస్తుంది ఎవరి పరిశీలన కరెక్టో.

ఈ గున్యా భాషలో ఉన్నవి ఉపసర్గలా? అనుబంధాలా? అన్న విషయంలో మా సమాచార సేకరణకి ముందు నాకో థియరీ ఉండింది. ఇది కొన్ని అంశాల్లో మన భాషల్లా ఉంది, అదీ బర్మా, థాయ్లాండ్ ప్రాంతాల భాష అని, నేను ఇందులో అనుబంధ పదాలు ఎక్కువ ఉంటాయని ఊహించాను. పొద్దునే World Atlas of Language Structures (WALS) అనబడు డేటాబేస్లో చూస్తే ఇది కనిపించింది.

(మూలం)

ఈ భాష మాట్లాడేది ప్రధానంగా బర్మా-థైలాండ్ ప్రాంతాల్లో. ఆ ప్రాంతానికి ఎడమపక్క మన దేశంలో post positions ఎక్కువుంటే, బర్మా-థైలాండ్ పరిసర ప్రాంతాల్లో మట్టుకు preposition భాషల ఆధిపత్యం ఎక్కువగా ఉంది (బర్మీస్ మట్టుకు మళ్ళీ మనలాగా అనుబంధాల భాషే!). నాకు ఇది సరిగ్గా మా గున్యా భాషకి శాస్త్రీయ నామధేయం తెలియదు కానీ karenic languages అన్న సినో-టిబెటన్ భాషా కుటుంబంలోని ఉపజాతికి చెందినది అని మాత్రం తెలుసు. ఒకట్రెండు ఇతర కరెన్ భాషలు కూడా అనుసర్గ ప్రధానంగా ఉన్నవి ఆ పటంలో ఉన్నాయి. మరొక కరెన్ భాష (Kayah Li) మట్టుకు అనుసర్గ, అనుబంధాల్లో ఏదీ ప్రస్ఫుటంగా లేని భాష (అంటే అసలు కారకప్రత్యయాలు లేవని కాదు – ఏ ఒక్క పద్ధతీ డామినేట్ చేయదని). కనుక దీన్ని బట్టి చూడబోతే గున్యా preposition భాష లా ఉంది. అక్కడ బొమ్మలో ఈ వివరాలు తెలిసిన భాషల్లో తొంభై శాతానికి పైగా ఉంటే ఉపసర్గలు, లేకుంటే అనుబంధాలు ప్రధానంగా ఉన్న భాషలే (దానికర్థం ఆ భాషల్లో ఇతర ప్రయోగాల్లేవని కాదు. ఇవి మిక్కిలి ఎక్కువ అని మాత్రమే!). కనుక ప్రస్తుతానికి గున్యా భాష ఉపసర్గ ప్రధానమైన భాష, ఒకటీ అరా ఉభయసర్గలు (circumpositions కి నా పదం) ఉన్నాయి అని తీర్మానిస్తున్నా, మళ్ళీ ఆ అమ్మాయిని కలిసేదాకా! లేకపోతే ఏదీ డామినేట్ చేయని భాష అయ్యుండాలి. ఇంకొన్ని కరక ప్రత్యయాల వివరాలు సేకరిస్తే తెలుస్తుంది.

ఇది కాకుండా మా చర్చ కోర్సు ప్రాజెక్టులమీదకి మళ్ళింది. నా మానాన నేను ఇంకోళ్ళతో జతచేరకుండా “వీలుంటే చేస్తాను” అన్న పద్ధతికి మా లెక్చరర్ అంగీకరించింది. నాకు చాలా రోజులబట్టి ఆమ్రేడితాల (reduplication) గురించి కుతూహలం. మనకి ఉన్నట్లు ఆంగ్లంలో లేవు కదా? కానీ ఇదివరలో ఈ ప్రాంతాల్లో (మనతో సహా) అమ్రేడితాల వాడుక గురించి కొన్ని వ్యాసాలు చదివాను. అందువల్ల ప్రస్తుతానికి ఆ కోర్సు ప్రాజెక్టు చేసే వ్యవధి ఉంటే ఈ గున్యా భాషలో ఆమ్రేడితాల గురించి చిన్న పరిశోధన చేద్దామని అనుకుంటున్నాను. ఎందుకన్నా మంచిదని WALS వారిని మళ్ళీ అడిగాను.

(మూలం)

మొత్తం ఆ సైడంతా పూర్తి లేదా పాక్షిక ఆమ్రేడితాల సృష్టి ఉంది అన్ని భాషల్లో. కనుక ఈ గున్యాలో కూడా ఉండే ఉండాలి. కానీ, ఇందాకటి పటంతో పోలిస్తే ఇందులో ఒక్క కరెనిక్ భాష కూడా లేదు. అవకాశం వస్తే, వీలు చిక్కితే, కాలం అనుకూలిస్తే, ఆ పటంలోకి ఇంకో చుక్కని చేర్చడం నా కోర్సు ప్రాజెక్టు.

Published in: on March 3, 2018 at 10:16 pm  Leave a Comment  
Tags: ,

“క్షేత్రశీల భాషాశాస్త్రం” అను Field Linguistics – 6 : ఏడోవారం

(ఈ సిరీస్ లోని పాత టపాలు ఇక్కడ.)
*********
వరుసగా మూడోవారం వర్గకాల (classifiers) గురించిన చర్చ కొనసాగింది. ఒక క్లాసు ఈ చర్చలకి కేటాయించి, ఒక క్లాసు మళ్ళీ కొత్త పదాల/వాక్యాల సేకరణకు కేటాయించాము. మూడో క్లాసులో సేకరించిన వాటి పై చర్చ, ఒక ఆన్లైన్ పరీక్ష జరిగాయి.

వర్గకాల గురించిన చర్చ: ఇతర భాషల్లో వర్గకాల గురించి – ముఖ్యంగా చైనీస్, జపనీస్, బర్మీస్ ఉదాహరణల గురించి చదివాము. ఏ భాషకా భాష ఉదాహరణలు తీసుకోడం బాగుంది కానీ, నాకింకా దాన్ని ఒక క్రమమైన పద్ధతిలో summarize చేయడం ఎలాగో వంటబట్టలేదు. మొదట్లో రాసినట్లు, అదొక వేరే రకం పరిశోధనా విధానం. నేను సారాంశం ఏదైనా సంఖ్యల, గణాంకాల సాయంతో చెప్పడానికి అలవాటు పడి ఉన్నాను కనుక, క్లుప్తంగా వీటి గురించి చెప్పడం ఇంకా రావడం లేదు నాకు. మాకు సూచించిన పరిశోధనా వ్యాసాలు కూడా భాషావేత్తల పద్ధతిలోనే ఉన్నాయి. తక్కిన అంశాలు కొత్తవైనా తొందరగా ఏదో ఒకటి చేయగలిగాను (spectrograms analysis, ప్రశ్నావళులు తయారుచేయడం) గాని, ఈ పరిశోధనా పత్రాలు చదవడం మట్టుకు కొంచెం కొరకరాని కొయ్యగానే ఉందింకా. మొదటి రెండు క్లాసులకి మూడు పరిశోధన వ్యాసాలు మా రీడింగ్స్ లో ఉండగా, ఒక్కటి మట్టుకు వీటిలో కాస్త accessible గా అనిపించింది. అది గున్యాకి దగ్గర భాష అయిన బర్మీస్ గురించి కావడం, ఉదాహరణల్లో ప్రస్తావించిన అంశాలు ఇప్పటివరకు క్లాసులో చూసి ఉండడం వల్ల కావొచ్చు.

Classifier Systems and Noun Categorization Devices in Burmese
Author(s): Alice Vittrant
Proceedings of the Twenty-Eighth Annual Meeting of the Berkeley
Linguistics Society: Special Session on Tibeto-Burman and Southeast
Asian Linguistics (2002), pp. 129-148

భాషా వివరాల సేకరణ:
ఈ వారం మా సేకరణ ప్రధానంగా రంగులు, విశేషణాల వాడుక చుట్టూ తిరిగింది. వివిధ రంగులని వాళ్ళ భాషలో ఏమంటారు? వివిధ రకాల విశేషణాలని ఏమంటారు? వాటిని వాక్యాల్లో ఎలా వాడతారు? సంఖ్యా వాచకాలతో కలిపి వాడినపుడూ (రెండు ఎర్ర ఆపిల్స్ వంటివి) పదాల క్రమం ఎలాంటిది? ఒకే నామవాచాకానికి ముందు రెండు విశేషణాలు వస్తే (రెండు పెద్ద ఎర్ర అరటిపళ్ళు) పదాల క్రమం ఎలాంటిది? ఇలాంటివి. ఇక్కడ ముఖ్యాంశాలు:

– సంఖ్యా వాచకాలు చివర్లో, విశేషణాలు నామవాచకానికి, సంఖ్యా పదాలకి మధ్యలో వస్తున్నాయి. two red apples కి పద క్రమం – అపిల్ ఎర్ర రెండు వర్గకం. two bags of red apples కి పదక్రమం ఆపిల్ ఎర్ర సంచి రెండు వర్గకం . two big bags of red apples కి ఆపిల్ ఎరుపు పెద్ద రెండు సంచి వర్గకం (పొత్స గ్వొ తెడొ కిద్దె)- ఇంతకీ ఇందులో “తె” కి అర్థం ఇంకా తెలీదు. అడిగి కనుక్కోవాలి.

– ఒకట్రెండు క్రియా విశేషణాల (adverbs) గురించి అడిగినదాన్ని బట్టి అర్థమైనది – వాళ్ళకి ఇంగ్లీషులాగ క్రియ తరువాత వస్తాయవి. మనకి ముందు వస్తాయనుకుంటా. she ran quickly అంటే “ఆమె తొండరగా పరుగెత్తింది” అంటాము కదా మామూలుగా!

– “A big red old pretty apple” అన్న వాక్యం గురించి తెలుసుకుంటూ తెలుగులో ఎలా రాస్తారని అడిగారు నన్ను. అక్కడ ఉద్దేశ్యం విశేషణాలు రాసేప్పుడు ఏ రకానికి ప్రధాన్యం ఎక్కువ అని తెలుసుకోవడం (ఆంగ్లం లో big red apple అంటాము కానీ red big apple అనము కదా మామూలుగా. అలాంటివి). అయితే ఒక్క పట్టాన నాకు తెలుగులో ఈ వాక్యానికి సమానార్థకం తట్టలేదు. ఒక్క పట్టాన వాళ్ళ భాషలో ఏమంటారో కూడా అర్థం కాలేదు గాని, మాట్లాడుతూండగా ఆమె ఒకటనింది – విశేషణాల మధ్య “ల” అన్న ప్రత్యయం చేరిస్తే (మరియు కి సమానార్థకం) విశేషణాలు ఎలా చెప్పినా అర్థమవుతుంది అన్నది. ఆ లెక్కన “ఒక పెద్ద, పాత, ఎర్రటి, అందమైన ఆపిల్” అని చెప్పొచ్చేమో నేను కామాలూ అవీ ఉపయోగించి. అందమైన ఆపిల్ ఏమిటో అయినా! రుచికరమైన అని కాబోలు. వాళ్ళ భాషలో ఈ “ల” ప్రత్యయం లేకుండా చెప్పాలంటే: “ఆపిల్ ఎర్ర అందమైన పాత పెద్ద ఒకటి”. అదేం క్రమమో ఇంకా అర్థం కాలేదు.

– నారింజ రంగన్నది నారింజ పండు నుండి వచ్చిందా? నారింజ పండుకు రంగు నుండి ఆ పేరొచ్చిందా? అన్నది నేనెప్పుడూ ఆలోచించలేదు. వీళ్ళ భాషలో రెంటి గురించి అడుగుతున్నప్పుడు తెలిసిన విషయం – నారింజ రంగు కి వీళ్ళ పదం – “నారింజ పండు రంగు” అన్న అర్థం కలది. అంటే పండు నుంచి రంగుకి పేరొచ్చిందనమాట. అన్నట్లు పోయిన్సారి దీని విషయం ప్రస్తావించినపుడు మనకి నారింజ పదం ఇంకెక్కడినుంచో వచ్చింది కాబోలని రాశాను. నిజానికి వాళ్ళకే మనవైపు నుండి వెళ్ళిందట! “The word orange derives from the Sanskrit word for “orange tree” (नारङ्ग nāraṅga), which in turn derives from a Dravidian root word (from நரந்தம் narandam which refers to Bitter orange in Tamil)” – అని వికీపీడియా చెప్పింది. అక్కడే మరో వాక్యం కూడా ఉంది: “The color was named after the fruit,[26] and the first recorded use of orange as a color name in English was in 1512”. అని. మొత్తానికి ఈ రంగు పేరు మామూలుగా చెట్టు నుండి వచ్చినట్లు ఉంది చాలా భాషల్లో!

ఈ లెక్కన గతవారం నాటి టీ వ్యాసం లాగా, చాలా భాషల్లో ఈ పదానికి అర్థం నారింజ కి దగ్గర్లో ఉండాలి కాబోలు. గున్యా వేరు. లుమొత్స అన్నది వాళ్ళ పదం. వికీపీడియాలో చదివిన ప్రకారం ఆసాం, బర్మా, చైనా లలో ఈ పంట మొదట్లో పండేదట. కనుక ఈ భాషల్లో బహుశా దీనికి నారింజకి సంబంధంలేని పదాలు ఉండొచ్చు. చైనా పదం గూగుల్లో దొరికింది. బర్మా పదం గున్యా కి దగ్గరగానే ఉండొచ్చు. అసమీస్ పదం ఎవర్నన్నా అడగాలి. ఆల్రెడీ తక్కువగా కనబడే భారతీయ భాషల్లో మళ్ళీ అసామీస్ మరీ తక్కువలా ఉంది. నాకు ఒక సరైన డిక్షనరీ కూడా కనబడలేదు అంతర్జాలంలో!

ఇంకా కొన్ని రికార్డ్ చేశాము కానీ, ఆ రికార్డింగులు విన్నాక నాకు అయోమయం ఎక్కువైంది. కనుక అవి ప్రస్తుతానికి ప్రస్తావించడంలేదు.

పరీక్ష గతంలో లాగే గున్యా ఆడియో విని ఆంగ్ల అనువాదాన్ని గుర్తించడం – మల్టిపుల్ చాయిస్. నాకు 22 ప్రశ్నలకి గాను 20 మార్కులు, అదీ ప్రధానంగా పదాలు గుర్తుండి వాక్యంలో కాంటెక్స్ట్ బట్టి ఊహించినందువల్ల రావడం నాకు ఆనందాన్నించింది. ఆ పోయిన రెండూ – స్మాల్ కి షార్ట్ అని, షార్ట్ కి స్మాల్ ని అనువాదం చేసినందువల్ల పోయాయి. కొంచెం వృత్తిరిత్యా నాకున్న పనుల మధ్య ఈ క్లాసుకి సమయం కేటాయించడం (వారానికో ఐదు గంటలు కనీసం- మూడు గంటలు క్లాసులకి, ఒక రెండు గంటలు చదువూ, బ్లాగింగ్ వగైరా) కష్టంగానే ఉన్నా దాదాపు సగం సెమెస్టర్ నెట్టుకొచ్చేశాను. మరీ టాప్ స్టూడెంటుని కాకపోయినా, కనీసం ఏం జరుగుతోందో అర్థం అవుతోంది, మధ్యమధ్యలో ప్రశ్నలు వేయగలుగుతున్నాను, పరీక్షల్లో పర్వాలేదు. ఇంకొన్ని వారాలు కొనసాగగలననే అనుకుంటున్నాను. పోను పోను ఈ భాషాపరంగా సేకరించే అంశాలు కూడా నాకు కష్టతరం అవుతున్నాయి కానీ, ఏదో నేర్చుకుంటున్నాను అన్న తృప్తి అయితే ఉంది ప్రస్తుతానికి.

Published in: on February 26, 2018 at 1:16 am  Comments (2)  
Tags: ,

“క్షేత్రశీల భాషాశాస్త్రం” అను Field Linguistics – 5 : ఆరోవారం

(ఈ సిరీస్ లోని పాత టపాలు ఇక్కడ.)
*********
గత రెండు వారాలలో మా క్లాసులో సేకరించిన సమాచారాన్ని బట్టి ఈ గున్యా భాషలోని బహువచన సూచనకాల గురించి అనేక ప్రశ్నలు ఉదయించాయని నా బ్లాగులో రాసుకున్నాను. క్లాసులో కూడా చాలా చర్చించాము. దాదాపుగా రెండు పూర్తి క్లాసులు దీనికే సరిపోయింది ఆరోవారంలో. ఒక క్లాసులో యధావిధిగా కొత్త సమాచారం సేకరించాము.

ఆకారాన్ని బట్టి వాడే బహువచన సూచకాలు (ప్రత్యయాలు కావంట) తూర్పు ఆసియా భాషల్లో తరుచుగా కనిపిస్తాయట. వీటిని వర్గకాలు (classifiers) అంటారంట భాషాశాస్త్రంలో. అంటే రెండు పెన్నులు అన్నదానికి, రెండు కప్పులు అన్నదానికి జోడయ్యే బహువచన సూచకం వాటి ఆకారాలు వేరు కనుక వేరుగా ఉంటుంది. (వర్గకాలు నేను కనిపెట్టిన పదాం కాదు. తెలుగు అకాడెమీ వారి భాషా శాస్త్ర పారిభాషిక పదకోశం లోనిది.). మొట్టమొదట పోయిన వారం దీని గురించి చదివినపుడు ఆంగ్లంలో a grain of salt, a loaf or bread ఇలా ఉన్నట్లు, తెలుగులో “బియ్యపు గింజ, అన్నం మెతుకు” ఇలా ఉన్నట్లు – వీళ్ళ భాషలో అవి ఉన్నాయి కాబోలు అనుకున్నాను కాని, ఇవి కొలత పదాలు (measure words) అనీ, వీటిని వర్గకాల్లో కలపాలా వద్దా అన్నది భాషావేత్తల్లో ఇంకా ఎటూ తేలని ప్రశ్న అనీ తెలిసింది. అయితే, క్లాసులో సూచించిన వ్యాసాలు చదవడం వల్ల రెండింటికి ఉన్న తేడా అర్థమైంది.

ఇది తప్పిస్తే మరొక అంశం – ఆ భాష నిర్మాణం గురించిన ఇతర వివరాలు ఎలా సేకరించాలి? ఎలాంటి ప్రశ్నలు అడగాలి? అన్నది. ఫీల్డ్ లింగ్విస్టులకోసం ఇటువంటి అంశాల గురించి అంతర్జాలంలో ఉన్న వనరుల గురించి తెలుసున్నాము. ఉదాహరణకు – ఈ మాక్స్ ప్లాంక్ ఇన్స్టిట్యూట్ వారు భాషాశాస్త్రంలోని వివిధ విభాగాలు (ఉదా: పదనిర్మాణం, వ్యాకరణం, పదసంపద వగైరా) గురించి ఎలాంటి సమాచారం సేకరించాలి? ఎలా సేకరించాలి? అన్న విషయమై కొన్ని ప్రశ్నావళులు రూపొందించారు. కొన్ని ఆ భాష వాళ్ళని అడిగేందుకు, కొన్ని ఈ భాషావేత్తలు ఏం అడగాలో సన్నాహాలు చేసుకోవడానికి. కళ్ళు బైర్లు కమ్మాయి ఆ ప్రశ్నల విస్తృతి చూసి. పైగా ఆట్టే గొప్ప భాషాశాస్త్ర జ్ఞానం లేక అసలీ ప్రశ్నలు మామూలు మనుషుల్ని ఎలా అడగాలో కూడా తట్టలేదు ఇప్పటికి. కనుక దీని గురించే విద్యార్థులం గుంపులుగా ఏర్పడి చర్చించుకున్నాము – వచ్చేవారం ఏం ప్రశ్నలు అడగొచ్చని. అయితే, గత కొద్ది వారాలుగా అడుగుతున్న వాటికి కొనసాగింపుగా విశేషణాలు, వర్గకాలమీద దృష్టి పెట్టి ప్రశ్నలు తయారు చేశాము (వర్గకాలు ఐచ్ఛితాలా, లేకపోతే తప్పనిసరా? రకరకాల విశేషణాలు – అంటే పరిమాణాన్ని తెలిపేవి, ఆకారాన్ని తెలిపేవి ఇలాంటీవి – వాడ్డంలో తేడాలు ఉన్నాయా? ఇలాంటి ప్రశ్నలనమాట.

బుధవారం సమాచార సేకరణలో వీళ్ళ భాష గురించి భాషాశాస్త్ర పరంగా తెలిసిన సమాచారంకంటే సాంస్కృతిక సమాచారం ఎక్కువనిపించింది నాకు. కొన్ని ముఖ్యాంశాలు:

అ) పండ్లు: ఆపిల్, నారింజ – వంటి పదాలకి వాళ్ళకేవో అచ్చమైన గున్యా పదాలున్నాయి. మనకి ఆపిల్ కి అచ్చ తెలుగు పదం ఉందో లేదో నాకు తెలియదు కానీ, నారింజ అన్న పదం యూరోపియన్ భాషలకి సంబంధం ఉన్న పదమే అనుకుంటాను. కానీ, వీళ్ళ భాషలో ఈ రెంటికి ఉన్న పదాలు (పోత్స, లుమొత్స) ఇదివరలో ఏ భాషలో విన్న పదానికీ సంబంధం లేనివి. వాళ్ళకి బహుశా ఆ చెట్లు/పంటలు బైటినుంచి వచ్చినవి కావేమో అనిపించింది. స్ట్రాబెర్రీ, బ్లూబెర్రీ వంటివి మట్టుకు ఆ పేర్లతోనే పిలుస్తున్నారు – వాళ్ళ భాషలో పదాల్లేవు. మనకూ లేవని ధీమాగా చెప్పాను కానీ, ఆంధ్రభారతిలో స్ట్రాబెర్రీ కి తుప్పపండనీ, ఇంకో బెర్రీకి ఇంకేదో అనీ ఇలా పదాలున్నాయి – ఎవరూ వాడగా నేనెప్పుడూ వినలేదు.

ఆ) సపోటా – వాళ్ళకి దొరికి బయట దొరకని పండు ఒకటి చెప్పమంటే నా మనసులో సపోటా మెదిలింది – అది బైట దొరకదు కనుక. విచిత్రం ఏమిటంటే, ఆమె వర్ణించిన పండు కూడా అదే! ఆ అమ్మాయి వర్ణన బట్టి నేను గూగుల్ ఇమేజెస్ లో సపోటా చూపిస్తే ఆ అమ్మాయి అదే అన్నది. అందరం ఆశ్చర్యపోయాము.

ఇ) ద్రవపదర్థాన్ని వీళ్ళ భాషలో టీ అంటారట. పాలు, కాఫీ, పళ్ళరసం, తేనీరు అన్ని పదాలు టీ తో ముగుస్తాయి. తేనీటిని ఏమంటారు అంటే – తేయాకు అయితే లపా అని, తేనీరైతే లపాటీ అనీ అంటారని చెప్పింది. ఇందులో ఆసక్తికరమైన అంశం ఏమిటంటే కొన్నాళ్ళ క్రితం ఓ వ్యాసం చదివాను – ప్రపంచ భాషల్లో చాలా మటుకు తేనీటికి రెండే అక్షరాలతో ఉండే పేర్లు ఉంటాయి – చా కానీ, తే కానీ ఉంటాయని సిద్ధాంతం. వ్యాసంలో మొదటి రెండు వాక్యాలు – “With a few minor exceptions, there are really only two ways to say “tea” in the world. One is like the English term—té in Spanish and tee in Afrikaans are two examples. The other is some variation of cha, like chay in Hindi.” గున్యా ఆ exceptions లో ఒకటనమాట!!

Published in: on February 18, 2018 at 1:43 am  Leave a Comment  
Tags: ,

“క్షేత్రశీల భాషాశాస్త్రం” అను Field Linguistics – 4 : ఐదోవారం

(ఈ సిరీస్ లోని పాత టపాలు ఇక్కడ.)
*********

విజయవంతంగా ఐదోవారం కూడా పూర్తి చేశాను ఫీల్డ్ లింగ్విస్టిక్స్ విద్యార్థిగా! చేసే కొద్దీ నాకు కొత్త విషయాలు తెలియడం మామూలుగా ఊహించినదే అయినా, నేను కూడా కొంచెం ఈ విధమైన అధ్యయనంలో మెరుగు అవుతున్నట్లు అనిపిస్తోంది. అలాగే, నా అసలు పనిని, పరిశోధనని కూడా ఇందులో తెలుసుకుంటున్న అంశాలు ప్రభావితం చేస్తున్నట్లు అనిపిస్తోంది ప్రస్తుతానికి.

ఈ వారం కొత్త పదాల వివరాలు సేకరించడంతో పాటు చిన్న చిన్న వాక్యాలను కూర్చడం ద్వారా వాక్యాల్లో పదాల క్రమం గురించి కొంత తెలుసుకున్నాము. సోమవారం క్లాసంతా షరా మామూలుగా spectrogram లని అనలైజ్ చేయడం ద్వారా ఆ భాషలోని శబ్దాలకి ఒక inventory తయారు చేయడం కొంత సాధన చేశాము. మామూలుగా భాషలోని శబ్దాలను అధ్యయనం చేసేవాళ్ళు Vowel charts అని తయారు చేస్తారు – అచ్చులు పలుకుతున్నప్పుడు శబ్దంలోని వైబ్రేషన్ బట్టి, ఎక్కడ నుంచి పలుకుతున్నాం అన్న దాన్ని బట్టి, కొన్ని frequencies ఉంటాయి శబ్దాలకి. Formants అంటారు. మొదటి రెండు ఫార్మంట్లను బట్టి ఒక 2-Dimensional plot వేస్తారు – ఆ భాషలోని అచ్చులకి. దాన్ని బట్టి మనకి ఆ భాషలోని sound inventory కొంత తెలుస్తుందనమాట. అలా ఆంగ్లంలో – మళ్ళీ అందులో కొన్ని యాసలకి, ఇలా ప్రత్యేకం vowel charts ఉన్నాయి. ఆ పద్ధతిలో మేము ఇప్పటిదాకా రికార్డు చేసిన వాటి నుంచి ఈ భాషకి ఒక vowel chart చేయడం సోమవారం మేము చేసిన పని. నిజజీవితంలో ఇలాంటివి చాలామంది నుండి సేకరించిన రికార్డింగులని బట్టి సగటు విలువలని అంచనా వేసి తయారు చేస్తారు. మేము మాకున్నది ఒక్క మనిషే కనుక ఆమె రికార్డింగుల మీదే ఆధారపడ్డాము. నాకు ఈ acoustic analysis కొత్తా కావడం వల్ల ఇంకా పూర్తిగా నైపుణ్యం రాలేదు కాని, plot చేస్తూంటే ఈ భాషలో కొన్ని అచ్చు శబ్దాలు ఆంగ్ల ప్లాట్ లో అసలు ఆ పాయింట్ల వద్ద లేవనీ, కనుక అవి ఆంగ్లంలో లేని శబ్దాలని మట్టుకు అర్థమైంది. చివర్లో ఈ వివరాలు సేకరిస్తున్నప్పుడు వీటిని క్రమ పద్ధతిలో నోట్ చేసుకోవడానికి వాడే Leipzig glossing rules గురించి తెలుసుకున్నాము.

బుధ వారం చాలా మటుకు శ్వి నుండి కొత్త పదాల వివరాలు సేకరించడంలోకి వెళ్ళింది. This cat, these cats, these 4 cats, these 4 black cats ఇలా మధ్యలో విశేషణాలు, సంఖ్యావాచకాలు చేరుస్తూ కొంత డేటా సేకరించాము. ఇందులో ఆయా పదాలు ఏమిటన్న ఆసక్తి తో పాటు అవి వాక్యంలో ఏ క్రమంలో వస్తాయన్నది తెలుస్కోవడం కూడా మా ముఖ్యోద్దేశ్యం. ఇక్కడ నేను గమనించిన ముఖ్యమైన అంశాలు:

అ) ఆంగ్లం/తెలుగులో లా కాక విశేషణాలు నామవాచాకానికి తరువాత వస్తాయి (మంచి బాలుడు అన్నది వీళ్ళ భాషలో బాలుడు మంచి అవుతుంది)
ఆ) బహువచన సూచకాలు (అవి ప్రత్యయాలా? ప్రత్యేక పదాలా? అని మాకు కొత్త సందేహం మొదలైంది ఈ వారంలో!) చివర్లో వచ్చాయి.
ఇ) సంఖ్యావాచకాలు విశేషణాల తరువాత వస్తాయి (రెండు మంచి పుస్తకాలు అంటే – పుస్తకం మంచి రెండు లు – అన్నది వీళ్ళ క్రమం!)
ఈ) నిర్దేశక సర్వనామాలు (this/that/these/those వంటివి, ఆ/ఈ వంటివి) వీటన్నింటికంటే చివర వస్తున్నాయి (అవి రెండు మంచి పుస్తకాలు అంటే – పుస్తకం మంచి రెండు లు అవి – అన్నది వాక్య క్రమం)
ఉ) ఇతర సర్వనామాలు (నా/నీ/మీ/అతని/అతను/నేను) వంటివి మటుకు వాక్యం మొదట్లోనే వస్తాయి (నా రెండు పెద్ద పుస్తకాలు అంటే – నా పుస్తకం పెద్ద రెండు లు)

బహువచన ప్రత్యయాల గురించి ఇంకా క్లారిటీ రాలేదు. ఆ ఏడెనిమిది రకాలు – వస్తువుల ఆకారాన్ని బట్టి బహువచన ప్రత్యయాలు మారతాయి అన్నది ఆ అమ్మాయి, కానీ మళ్ళీ దీనికి మినహాయింపులు ఉన్నాయి. ఇది కాక ఒక్కోచోట బహువచన ప్రత్యయాలతో పాటు ఆయా పదాలకు అమ్రేడిత రూపాలు (reduplication) చేరుతున్నాయి. ఉదా: కప్పు కి టిక్వా అన్నది వాళ్ళ పదం. రెండు అంటే ఖీ. రెండు కప్పులంటే టిక్వా ఖీ క్వా. అది ఈ ఒక్క పదానికే అలా ప్రాసలా వచ్చింది మేము సేకరించిన వాటిలో. ఎందుకన్నది ఇంకా తెలీలేదు. కనుక బహువచనాల విషయం ఇంకా సస్పెన్సే.

శుక్రవారం ఈ సేకరించిన అంశాల గురించే కొంత చర్చ జరిగింది – నాకు డిపార్ట్మెంట్ ఫేకల్టీ మీటింగ్ ఉండడం వల్ల క్లాసు మిస్సయ్యాను. ఏం జరిగిందో సోమవారం తెలుసుకోవాలి.

పీ.ఎస్. టపా పోస్ట్ చేశాక ఈ పరిశీలనలని అర్థం చేసుకునేందుకు ప్రపంచ భాషల వర్గీకరణను శాస్త్రీయంగా అధ్యయనం చేసే భాషా శాస్త్ర విభాగం – Linguistic Typology తాలుకా పాఠ్య పుస్తకాన్ని తీశాను. దాన్ని బట్టి నాకు అర్థమైనది ఏమిటి అంటే –

అ) విశేషణం నామవాచకం తర్వాత రావడమన్నది నాకు పరమ విచిత్రంగా అనిపించింది గాని, నిజానికి ప్రపంచ భాషల్లో అదే సాధారణమట విశేషణం + నామవాచకంతో పోలిస్తే – మనకి అధిక వ్యాప్తి ఉన్న Indo-European భాషలూ, మన ద్రవిడ భాషల్లో కూడా అలా లేకపోయేసరికి నాకు కొత్తగా అనిపించింది.

ఆ) ఇక నిర్దేశక సర్వనామాలు చివర్న రావడం కూడా చాలా భాషల్లో ఉందట (ఏదో 1300+ భాషలతో చేసిన సర్వేలో 40శాతం దాకా భాషల్లో ఉందట).

పూర్తి వివరాలకు: Introduction to Linguistic Typology by Viveka Velupillai పాఠ్య పుస్తకం, అధ్యాయం 10 చదవగలరు. మరిన్ని వివరాలు వచ్చేవారం.

Published in: on February 11, 2018 at 3:57 am  Leave a Comment  
Tags: ,

“క్షేత్రశీల భాషాశాస్త్రం” అను Field Linguistics – 3 : నాలుగో వారం

(ఈ సిరీస్ లోని పాత టపాలు ఇక్కడ.)
*********

నాలుగోవారం క్లాసుల్లో మేము రెండు విషయాల మీద కేంద్రీకరించాము దృష్టిని.

అ) lexico statistics అన్న ఒక భాషల మధ్య సంబంధాలను అధ్యయనం చేసే పద్ధతి గురించి,
ఆ) స్వి నుండి మరికొన్ని పదాలకి అర్థాలు సేకరించడం గురించి
మూడోరోజు క్లాసులో పరీక్ష ఉండింది – స్వి వాళ్ళ భాష పదాలు పలికిన ఆడియో ఫైళ్ళు మా ప్రశ్నలు. ఆ పదాలకి ఆంగ్లానువాదాలు మా జవాబులు. బొత్తిగా పరీక్ష విషయం మర్చిపోయి క్లాసుకెళ్ళినా ఇరవై కి పద్దెనిమిది మార్కులొచ్చాయి కనుక నేను చాలా ఆనందపడ్డాను.

ఈ వారంలో ఈ భాష గురించి తెలుసుకున్న ముఖ్యమైన విషయాలు:
అ) అంకెలు రాయడం
ఆ) బహువచనాలకి చివర్లో వచ్చే పదాలు

అంకెలు: వీళ్ళకి సున్నా కి ముందు అంకె లేదుట. అది బర్మీస్ భాష నుండి అరువు తీసుకున్న పదం, “తొన్యా” అంటాము అని చెప్పిందా అమ్మాయి. “తొన్యా” శూన్యానికి దగ్గరగా ఉందని గూగుల్లో వెదికితే తెలిసిందేమిటంటే, అది బర్మీస్ లోకి సంస్కృతం నుండే వెళ్ళిందట! అది తప్పితే అంకెలు ఈ భాషలో తేలిగ్గానే వంటబట్టాయి. ఒకటి నుండి తొమ్మిది దాక ఉన్న పదాలు అన్నింట్లోనూ కామన్. పదులకి ఒక పదం, వందలకి ఒక పదం ముందు చేరుస్తారు అంతే.

బహువచనాలు: “బహువచనాలకి రెండు రెండు suffixలు ఉన్నాయి – అవి interchangeableగా వాడొచ్చు” అని పోయినవారం దాకా తెలిసిన అంశాల బట్టి తీర్మానించాను. ఈ వారం సేకరించిన వాటిని బట్టి ఈ తీర్మానం మార్చుకోవాలి అని తెలిసింది. వీళ్ళకి బహువచాలకి ఈ రెండూ కామన్ గా దేనికైనా వాడేసే పదాంతాలు (సఫిక్స్ కి నా తెలుగు పదం) ఉన్నాయి కానీ, ప్రత్యేకం ఆయా వస్తువుల ఆకారాన్ని బట్టి బహువచన పదాంతాలు కూడా ఉన్నాయట. ఈ అమ్మాయి ఈ విధంగా ఓ తొమ్మిది పదాంతాలను బహువచనాలకి వాడతారని చెప్పింది. గుండ్రంగా ఉండేవాటికి ఒక బహువచన పదాంతం, నిలువుగా ఉండేవాటికి ఒక బహువచన పదాంతం – ఇలా తొమ్మిది చెప్పింది. నాకు చాలా కొత్తగా అనిపించింది.

ఇతర పదాలు సేకరించిన వాటిలో నాకు ఆలోచించదగ్గవి గా అనిపించిన అంశం – చెట్టు, అడవి, ఆకు – మూడింటికి మొదటి సగం ఒకే పదం ఉండటం.

ఇవి కాక కొన్ని ప్రశ్నలు అడిగి మరికొంత సమాచారం సేకరించాము – ప్రధానంగా భాషలోని ధ్వనుల గురించి. అయితే, నాకు ఎందుకోగాని ఈ ధ్వనుల మీద క్లాసులో మా లెక్చరర్ కి, ఇతర విద్యార్థులకి ఉన్నంత ఆసక్తి కలగడం లేదు. Tonal languages లో టోన్ ని బట్టి పదాల అర్థం మారుతుంది కాని, మాకింకా అటువంటి పదాలు రాలేదు. అదొక కారణం కావొచ్చు – నేను “ఆ, పలుకుబడిదేముంది, ఒక్కోరూ ఒక్కోలా పలుకుతారు” అని నోట్సు ఉదాసీనంగా రాయడానికి. రాబోయే వారాల్లో ఈ ధోరణి మార్చుకుంటానేమో చూడాలి!

Published in: on February 4, 2018 at 11:39 pm  Comments (2)  
Tags: ,

“క్షేత్రశీల భాషాశాస్త్రం” అను Field Linguistics – 1

గత రెండు వారాలుగా నేను ఇక్కడ అండర్ గ్రాడ్యుయేట్ లింగ్విస్టిక్స్ విద్యార్థుల మధ్య స్టూడెంటుగా Field Linguistics అన్న క్లాసు కి వెళ్తున్నాను. అధికారికంగా విద్యార్థిని కాకపోయినా, లెక్చరర్ తో ఉన్న స్నేహం వల్ల ఈ అవకాశం లభించింది. దీన్ని తెలుగులో ఏమంటారో తెలియక సురేశ్ కొలిచాల గారిని అడిగితే “క్షేత్రశీల భాషాశాస్త్రం” అన్న ఈ పదం సూచించారు. సరే, జరిగింది రెండు వారాలే అయినా, ఇంకా పన్నెండు వారాలు మిగిలి ఉన్నా, ఇప్పటికే ఈ క్లాసు నాలో అనేక ఆలోచనలు రేకెత్తించింది. అవి రాసుకోవడానికే ఈ టపా.

ఇంతకీ ఏమిటిది?: క్లుప్తంగా చెప్పాలంటే ఒక భాషని అది మాట్లాడే ప్రాంతంలో అధ్యయనం చేసి, ఆ భాష నిర్మాణాన్ని గురించి పరిశోధించడం. పురావస్తు (archaeologist), పురాజీవ (paleontologist) శాస్త్రవేత్తల్లా ఈ క్షేత్రశీల భాషావేత్తలు కూడా లొకేషన్ కి వెళ్ళి అధ్యయనం చేస్తారు. కాకపోతే, వీళ్ళు జీవించి ఉన్న మనుషుల్తో ఉంటూ, వాళ్ళ జీవితం లో వాడే భాషని, పలుకుబడులని ఇతరత్రా భాషకు సంబంధించిన విషయాలు గ్రంథస్తం చేస్తారు. కనుక, బహుశా మానవ పరిణామ శాస్త్రవేత్తలతో (anthropologists) తో పోలిక కొంచెం దగ్గరగా ఉంటుందేమో.

ఎందుకు?: సరే, ఇదంతా ఎందుకు చేస్తారు? అని అడిగితే – పలు కారణాలు. నాకు తోచినవి చెబుతాను. అంతరించి పోతున్న భాషలని గురించి గ్రంథస్తం చేయడం ఒక కారణం. అది ఎందుకంటే, ఒక భాష అంటే ఒక సంస్కృతి. ప్రతి భాషకీ ఏదో ఓ ప్రత్యేకత ఉంటుంది, మానవజాతి గురించి ఏదో ఒక కొత్త విషయం చెబుతుందన్న నమ్మకం. మరో కారణం – అసలు భాష ఎలా పుట్టిందన్న కుతూహలం – ప్రపంచ భాషల మధ్య పోలికలు, భేదాలను గురించి తెలుసుకుని, భాష పుట్టుకని, మానవజాతి ఎదుగుదలని reconstruct చేయొచ్చు అన్న ఆశ. మూడో కారణం – ఆ భాష మాట్లాడే వాళ్ళకి సామాజికంగానో, రాజకీయంగానో గుర్తింపు తీసుకురావడం. నాలుగో కారణం – ఆ భాష పైన ఉన్న ప్రేమ, “నా భాషకోసం నేనేదన్నా చేయాలన్న తాపత్రేయం” (ఇది ఆ భాష మాట్లాడే వారికి!). ఇలా చాలా కారణాలు ఉండొచ్చు. మతప్రచారం కోసం పూర్వం చాలమంది మిషనరీలు ఇలాగే మారుమూల ప్రాంతాలకి వెళ్ళి ఆయా భాషల గురించి పుస్తకాలు రాశారు (మారుమూలని ఏముంది, తెలుగుకి కూడా ఇలాంటివి కనిపిస్తాయి గూగుల్ బుక్స్ లో వెదికితే, 1800ల నాటివనుకుంటాను). వీళ్ళు కాక, పూర్తిగా భాషని అధ్యయనం చేయడం కోసమే ఆ ప్రాంతాల్లో చాలారోజులు నివసించి పుస్తకాలు రాసిన వాళ్ళు ఉన్నారు (అలాంటి ఒకరి గురించి ఈమాట వెబ్ పత్రికలో ఇంటర్వ్యూ).

పద్ధతి: సాధారణంగా నిజజీవితంలో అయితే, ఈ క్షేత్రస్థాయి పరిశోధన చేసే భాషావేత్తలు ఆ అధ్యయనం చేసే ప్రాంతానికి వెళ్ళి కొన్నాళ్ళు మకాం వేసి, స్థానికులతో తిరిగి, వాళ్ళ భాష నిజజీవితంలో ఎలా వాడతారు? అన్నది తెలుసుకుని, రకరకాల ప్రశ్నల ద్వారా ఆ భాష తాలూకా స్వరూపాన్ని అర్థం చేసుకుంటారు. ఇదంతా ఆడియో/విడీయో రికార్డింగులు, వివరమైన నోట్సుల ద్వారా సేకరించి, తరువాత తమ పరిశోధనా ఫలితాలతో ఆ భాష తాలూకా వ్యాకరణం, ఆ భాష వారి సంస్కృతి గురించి, వాళ్ళ సాహిత్యం గురించి ఇతరత్రా అంశాల గురించి పుస్తకాలు, పరిశోధనాపత్రాలు వంటివి ప్రచురిస్తారు. కొంతమంది లాస్టుకి ఆ భాష ధారాళంగా మాట్లాడతారు కూడా. ఇక్కడ గుర్తుంచుకోవాల్సిన విషయం: సాధారణంగా వీళ్ళు వెళ్ళి అధ్యయనం చేసి పుస్తకాలు రాసేముందు ఆ భాష గురించి ప్రపంచానికి తెలిసింది చాలా తక్కువగా ఉంటుంది. ఇంటర్నెట్ ఉందిగా! అంటే చెల్లదు.

మేమేం చేస్తున్నాం?: క్లాసులో ఇదంతా చేయడం అసాధ్యం కనుక మాకు పద్ధతి కొంచెం వేరు. క్లాసు సోమ, బుధ, శుక్రవారాలు చెరో గంట నడుస్తుంది. మా క్లాసుకి ఒక అతిథి వారానికి ఒకసారి వస్తుంది. ఆ అమ్మాయి ఏదో గుర్తు తెలియని భాష మాట్లాడుతుంది (ఆ భాషేమిటో మాకు ప్రస్తుతానికి చెప్పరన్నమాట – నేరుగా ఇంటర్నెట్ ని ఆశ్రయించకుండా, అసలు పనెలా చేయాలో తెల్సుకోవాలి కనుక). సో, ఈ అమ్మాయి ని ప్రశ్నలు అడగడం ద్వారా ఆ భాష నిర్మాణాన్ని అర్థం చేసుకోవాలి. సోమ శుక్రవారాలు ఆ అమ్మాయి జవాబులని బట్టి ఆ భాష స్వరూపాన్ని అర్థం చేసుకోవడం, బుధవారం నాడు మళ్ళీ మేము అనుకున్నది కరెక్టా కాదా అని తనతో నిర్థారించుకోవడం. ఇదీ మా పని ప్రస్తుతానికి. ఉదాహరణకి – గుడ్ మార్ణింగ్, గుడ్ నైట్, గుడ్ ఈవెనింగ్, గుడ్ ఆఫ్టర్నూన్ – ఇలా కొన్ని పదాలు అడిగాము అనుకోండి, అన్నింటికి ఆవిడ జవాబులు పోల్చుకుని, ఏదన్నా నాల్గింటి లోనూ ఉంటే – అది “గుడ్” కి అర్థమా? అని అడిగి, నిర్థారించుకోవడం. ఇలా నెమ్మదిగా ప్రశ్నలడుగుతూ, ఆ భాష తాలూకా పదజాలం, పదనిర్మాణం (ఉదా: tense, gender, plural వంటివి ఎలా సూచిస్తాము?), వాక్య నిర్మాణం, పలుకుబడి (pronunciation), ఇలాంటివి గ్రహించాలి.

కొత్తదనం: సాధారణంగా సైన్సు, ఇంజనీరింగ్ నేపథ్యం నుండి వచ్చిన నాకు ఈ పద్ధతే చాలా కొత్తగా ఉంది. ఏదన్నా ఒకటి చేస్తే – దాన్ని evaluate చేయడానికి ఒక పద్ధతి అంటూ మొదట స్థిర పరుచుకుంటే కాని పరిశోధన మొదలవదు నాకు తెలిసిన విషయాల్లో (Natural Language Processing, Machine Learning). పరిశోధన పక్కనపెట్టి, ఏదన్నా అప్లికేషన్ కోసం ప్రోగ్రాం రాస్తున్నాం అనుకున్నా, మన ప్రోగ్రాం కరెక్టా కాదా? అన్నది తేల్చడానికి మనకి ఒక reference point ఉంటుంది (ఉదా: test cases). ఇక్కడ అది లేదు. ఆ అమ్మయి ఫలానా “what is your name” అన్నదానికి మా భాషలో “ఎక్స్ వై జెడ్” అంటారు అన్నదనుకోండి, అది మనం సరిగ్గా విన్నామా? ఆమె “ప” అన్నదా, “బ” అన్నదా? “డ”, “ద” మధ్య భేదం ఉందా (కొన్ని మాతృభాషల వాళ్ళకి కొన్ని శబ్దాలు ఉండవు – కనుక వాళ్ళు ఒక్కోసారి భేదాన్ని చూడలేరు)? ఎన్నిసార్లు రికార్డింగ్ ని రిప్లే చేసినా ఈ విషయమై మా మధ్య వాదోపవాదాలు జరుగుతూనే ఉన్నాయి. International Phonetic Alphabet అని ఒకటుంది. స్పెల్లింగ్ ని ఎలా పలుకుతామో అలా రాసే స్క్రిప్టు. నాకు ఇంకా రాదు కానీ, మన తెలుగులో అనేక శబ్దాలుండటం మూలాన క్లాసంతా IPA వాడుతూంటే నేను తెలుగు లో రాస్తున్న pronunciation ని. మరి వాళ్ళంతా టీనేజి పిల్లలు – వాళ్ళ దృష్టిలో నేను వయసు మళ్ళిన దాన్ని కనుక వాళ్ళు నా మానాన నన్ను వదిలేశారు ఈ విషయంలో, కొన్ని వారాల్లో నేర్చుకుంటానని ప్రామిస్ చేశాక.

అలా నాకిప్పటిదాకా పరిచయం ఉన్న తరహా చదువు, పద్ధతులు కాకుండా మొత్తానికే కొత్తగా ఉన్న పరిశోధనాత్మకంగా ఉన్న క్లాసు ఇది. ఏది సరి, ఏది కాదు – ఎలా నిర్ణయిస్తారు? అసలు ఈ నిజం field linguists ఆ రకరకాల భాషల గురించి ఎలా రాస్తారు? ఒకే ఒక స్పీకర్తో, క్లాసులో మనకే ఇన్ని భేదాభిప్రాయలుంటే, వాళ్ళు ఫీల్డులో, బహుశా ఆ భాష మాట్లాడే అనేకుల మధ్య ఇవన్నీ ఎలా అధ్యయనం చేస్తారు? ఎలా evaluate చేసుకుంటారు తాము చేస్తున్నది కరెక్టా? కాదా? అని? అసలు వీళ్ళ మోటివేషన్ సరే, ఆ స్థానికులెందుకు సపోర్టు చేస్తారు?- అని ఇలా ఎన్నో ప్రశ్నలు నాకు.

ఈ శబ్దాల విషయం లో భేదాభిప్రాయాల గురించి ఆలోచించి ఇప్పుడిప్పుడే తెలుసుకుంటున్న స్పీచ్, సిగ్నల్ ప్రాసెసింగ్ విషయాలతో గత వారమే ఒక చిన్న ప్రోగ్రాం రాయడం మొదలుపెట్టాను – స్పీకర్ మాట్లాడే శబ్దాలు ఆ IPA లో దేనికి దగ్గరగా ఉన్నాయో పోల్చి చెప్పడానికి. ఇంకా కొంచెం టైం పడుతుంది క్లాసులో స్టూడెంట్లకి ఉపయోగపడే స్థాయికి రావాలంటే (ఒకవేళ వర్కవుతే). ఇలా ఈ క్లాసుకి వెళ్ళడం, దాని గురించి చాలాసేపు ఆలోచించడం అవుతోంది కనుక, ఈ ఆలోచనలు, క్లాసు ద్వారా నేను తెలుసుకుంటున్న విషయాలు ఎక్కడో ఓ చోట నోట్సు రాసుకుందామని అనుకుంటూన్నాను. క్లాసులో అసైన్మెంట్లు, ఎక్సర్సైజులు నాకు మాండేటరీ కాదు – అధికారికంగా స్టూడెంటును కాను కనుక. అందువల్ల ఎంచక్కా తెలుగులో రాస్కోవచ్చని, చర్చల్లో మట్టుకు ఆంగ్లం లో పాల్గొంటే చాలని అనిపించింది. ఇది ఆరంభం.

Published in: on January 21, 2018 at 4:52 pm  Comments (2)  
Tags: ,

గూగులించు ప్రక్రియ వివరణ – తెలుగు పద్ధతులు

ఏదో బాగా తెలివిగా ఆలోచించాననుకొని ఆ శీర్షిక పెట్టాను గాని, నిజానికి విషయం ఏమిటంటే, ఇవ్వాళ Google the verb అని ఒక వ్యాసం చదివాను. వ్యాసకర్త Adam Kilgarriff ఈమధ్యనే (గత వారాంతంలో) మరణించిన ప్రముఖ computational linguist, Lexical Computing Ltd. అన్న కంపెనీకి డైరెక్టరు.

వ్యాసం వివరాలు కావాలంటే:
Google The Verb​
Adam Kilgarriff
Language Resources and Evaluation Journal, 44 (3), pp 281-290
ఆ లంకె ఉచితం గా చదవొచ్చో -“అనుచితమో” నాకు తెలియదు కనుక, ఆయన వెబ్సైటులో పెట్టిన లంకె కూడా ఇస్తున్నా.

జనం గూగుల్ అన్న పదాన్ని క్రియాపదంగా వివిధ భాషల్లో ఎలా వాడుతున్నారు? అని పరిశీలన. ఏందుకు? ఏమిటి? ఎలా? అన్నది ఆ రిపోర్టులో చదువుకోగలరు.

ఆయన అక్కడ 19 భాషల్లో వాడుకను గురించి రిపోర్టు రాశారు. మూడు భాషలకి (పర్షియన్, రొమేనియన్, ఐరిష్) భాషలకి గూగుల్, ఒక భాషకి బైడూ (చైనీస్) శోధనా యంత్రాలను వాడారు. తక్కిన వాటికి వాళ్ళ కంపెనీ అంతర్జాలం నుండి సేకరించిన మెటీరియల్ వాడుకున్నారు.

తెలుగు వాడుక గురించి రెండే ఉదాహరణలు ఉన్నాయి -“గూగుల్ చేసి, గూగుల్ చేశాడు”. ఉదాహరణకి ఆంగ్లంలో – “గూగుల్ ఇట్” అని ఎవరన్నా చెప్పారనుకోండి – తెలుగులో సమానార్థకంగా – “గూగుల్ చేయి”, “గూగుల్లో చూడు”, “గూగుల్ నుండి కనుక్కో”, “గూగుల్ ని అడుగు” ఇలా రకరకాలుగా చెప్పొచ్చు కదా.. “ఆయొక్క గూగుల్ యొక్క అభిప్రాయం ఒక పర్యాయం కనుక్కుని నీ యొక్క ప్రశ్న యొక్క సమాధానాన్ని పొందు” అని కూడా చెప్పొచ్చు. దానితో నాకు కుతూహలం కలిగింది – జనం గూగుల్ వాడకం గురించి ఎన్ని రకాలుగా రాస్తారు తెలుగులో అని. దానితో రకరకాల విభక్తి ప్రత్యయాల సాయంతో గూగుల్ ని ఈ విషయమై ప్రశ్నించి, ఎన్ని “శోధనా ఫలితాలు” అందిస్తోందో అని చూశాను (అలా చూడకండి.. ఏదో, అదో తుత్తి!).

ని, ను, నుండి, లో, కి, కు, యొక్క, చే* (అంటే చే తో మొదలయ్యే కొన్ని క్రియాపదాలు అని భావము) – ఇవి చూశా ఇవాళ. శోధనా ఫలితాల్లో వచ్చిన రిజల్ట్స్ జాబితా ఇదీ: (క్వెరీ ఉదాహరణకి “గూగుల్ తో” అని కోట్స్ లో ఇచ్చాను)

గూగుల్ ని – 457 (గూగుల్ని అడిగాను టైపు వాక్యాలు అనమాట)
గూగుల్ని – 631 (పై లాంటివే, గూగుల్ ని, ని నీ కలిపేసి ఉన్నవి)
గూగుల్ ను – 1520 (గూగుల్ ని బదులు గూగుల్ ను)
గూగుల్ను – 735 (గూగుల్ ని, ను ని కలిపేసినవి)
గూగుల్ నుండి – 2880 (గూగుల్ నుండి తెలుసుకోవడం లాగ)
గూగుల్ చేసి – 457 (గూగుల్ చేసి చూడు, అప్పు చేసి చూడు టైపులో)

గూగుల్ కి – 884 (గూగుల్ కి చెప్పు టైపు భావుకత కావొచ్చు)
గూగుల్కి – 365 (గూగుల్కి బుద్ధి లేదు టైపు ఫ్రస్ట్రేషన్ కూడా కావొచ్చు)
గూగుల్ కు – 1350
గూగుల్కు – 3010
గూగుల్ యొక్క – 563
గూగుల్యొక్క -0
గూగుల్ లో – 6860 (గూగుల్ లో వెదికితే కనిపిస్తుంది టైపు వాక్యాలు)
గూగుల్లో – 11,300 (పై రకానివే, పదాల మధ్య స్పేస్ లేకుండా)

ఇపుడు ఈ పిడకలవేటలో నాకు ఆసక్తి కలిగించిన అంశాలు రెండు:
మొదటిది: నేను గూగుల్ని/గూగుల్ను బాగా ఎక్కువగా వాడి ఉంటారేమో అనుకున్నా (మాలతీ చందుర్ నన్ను అడగండి తరహాలో ఆలోచించాలెండి!)
రెండవది: నేను ఆ విభక్తి ప్రత్యయం కలిసిపోయి ఉన్న పదాలకి ఎక్కువ ఫలితాలు వస్తాయల్నుకున్నా (గూగుల్ లో vs గూగుల్లో). కానీ, కొన్నింట్లో అది నిజమైంది, కొన్నింటికి కాదు. ఉదా: “గూగుల్ లో” కంటే “గూగుల్లో”కి ఎక్కువ ఫలితాలు వచ్చాయి. కానీ, “గూగుల్కి” కంటే “గూగుల్ కి” కి ఎక్కువొచ్చాయి. ఎందుకలాగ? అంటే నాకు తెలీదు.

పన్లోపనిగా తెలుగు వారి వ్యావహారికంలో గూగుల్ అమ్మాయా? అబ్బాయా? అన్నది కూడా పరిశీలించా.
గూగులుడు – 1
గూగులన్న – 2
గూగులక్క – 1
గూగులయ్య – 184
గూగులమ్మ – 1050
-బహుశా చివరి పదం రానారె గారి గూగులమ్మ పదాల వల్ల అలా ప్రచారం పొందిందేమో 🙂 మొత్తానికి గూగుల్ అమ్మే లాగుంది తెలుగులో.

ఇంకా ఏమేం గమనించొచ్చు? అన్నది ఇంకా ఆలోచించలేదు (“if you torture it enough, you can get it to confess to anything” అని డేటా గురించి సామెత). ఇక్కడెవరో పనిలేని మంగలి సామెత గుర్తు తెచ్చుకుంటూండవచ్చు. Kilgarriff గారి మరణం గురించి విన్నాక మౌనం పాటించే బదులు ఆయన రాసినదేదన్నా కాసేపు చదువుదాం అని అటు వెళ్తే ఇది కనబడింది. దానితో, ఈ బాట పట్టాను అనమాట.

Published in: on May 19, 2015 at 11:49 am  Comments (1)  
Tags:

PhD – A Depiction

I got this in an email forward and I continue to be amused looking at it even a few days later.
(If this image is copyrighted, let me know by dropping a comment here. Will remove the post.)

Published in: on August 12, 2012 at 11:42 am  Comments (1)