On an impulse, I started looking at the issues of a journal called Educational Researcher. I just started looking (just looking) at all the titles of all articles since 1972. One of the titles I found was: “On the Nature of Educational Research” and these were the concluding remarks from that article.

“Openmindedness is not empty mindedness, however, and it is not tolerance of all views good or bad. It is having a sincere concern for truth and a willingness to consider, test, argue and revise on the basis of evidence our own and others’ claims in a reasonable and fair manner (Hare, 1979). This doesn’t mean that we will always reach agreement, or even that we will always be able to understand and appreciate the arguments of others, or that we cannot be committed to a position of our own. Openmindedness only requires a sincere attempt to consider the merits of other views and their claims. It does not release us from exercising judgement.”

From: “On the Nature of Educational Research” by Jonas F.Soltis. Educational Researcher. 1984. 13 (5)
If anyone has access, it could be read here.

The Hare, 1979 referred in this quote is this.

I wonder if the quote is only valid for that context of education!

“Linguistically Naive != Language Independent” and my soliloquy

This post is about a paper that I read today (which inspired me to write a real blog post after months!)

The paper: Linguistically Naive!= Language Independent: Why NLP Needs Linguistic Typology
Author: Emily Bender
Proceedings of the EACL 2009 Workshop on the Interaction between Linguistics and Computational Linguistics, pages 26–32. ACL.

In short, this is a position paper, that argues that incorporating linguistic knowledge is a must if we want to create truly language independent NLP systems. Now, on the surface, that looks like a contradictory statement. Well, it isn’t ..and it is common sense, in.. er..some sense ;)

So, time for some background: an NLP algorithm that offers a solution to some problem is called language independent if that approach can work for any other language apart from the language for which it was initially developed. One common example can be Google Translate. It is a practical example of how an approach can work across multiple language pairs (with varying efficiencies ofcourse, but that is different). The point of these language independent approaches is that, in theory, you can just apply the algorithm on any language as long as you have the relevant data about that language. However, typically, such approaches in contemporary research eliminate any linguistic knowledge in their modeling and there by make it “language” independent.

Now, what the paper argues for is clear from the title – “linguistically naive != language independent”.

I liked the point made in section-2, where in some cases, the surface appearance of language independence is actually a hidden language dependence. The specific example of ngrams and how efficiently they work, albeit for languages with certain kind of properties, and the claim of language independence – that nailed down the point. Over a period of time, I became averse to the idea of using n-grams for each and every problem, as I thought this is not giving any useful insights neither from a linguistic nor from a computational perspective (This is my personal opinion). However, although I did think of this language dependent aspect of n-grams, I never clearly put it this way and I just accepted that “language independence” claim. Now, this paper changed that acceptance. :-)

One good thing about this paper is that it does not stop there. It also explains about approaches that use language modeling but does slightly more than ngrams to accommodate various types of languages (factored language models) and also talks about how a “one size fits all” approach won’t work. There is this gem of a statement:

“A truly language independent system works equally well across languages. When a system that is meant to be language independent does not in fact work equally well across languages, it is likely because something about the system design is making implicit assumptions about language structure. These assumptions are typically the result of “overfitting” to the original development language(s).”

Now, there is this section on language independence claims and representation of languages belonging to various families in the papers of ACL 2008. This concludes saying:
“Nonetheless, to the extent that language independence is an important goal, the field needs to improve both its testing of language independence and its sampling of languages to test against.”

Finally, the paper talks about one form of linguistic knowledge that can be incorporated in linguistic systems – linguistic typology and gives pointers to some useful resources and relevant research in this direction.

And I too conclude the post with the two main points that I hope people noticed in the research community:

(1) “This paper has briefly argued that the best way to create language-independent systems is to include linguistic knowledge, specifically knowledge about the ways in which languages vary in their structure. Only by doing so can we ensure that our systems are not overfitted to the development languages.”

(2) “Finally, if the field as a whole values language independence as a property of NLP systems, then we should ensure that the languages we select to use in evaluations are representative of both the language types and language families we are interested in.”

Good paper and considerable amount of food for thought! These are important design considerations, IMHO.

The extended epilogue:

At NAACL-2012, there was this tutorial titled “100 Things You Always Wanted to Know about Linguistics But Were Afraid to Ask“, by Emily Bender. At that time, although I in theory could have attended the conference, I could not, as I had to go to India. But, this was one tutorial that caught my attention with its name and description and I really wanted to attend it.

Thanks to a colleague who attended, I managed to see the slides of the tutorial (which I later saw on the professor’s website). Last week, during some random surfing, I realized that an elaborate version was released as a book:

Linguistic Fundamentals for Natural Language Processing: 100 Essentials from Morphology and Syntax
by Emily Bender
Pub: Synthesis Lectures on Human Language Technologies, Morgan and Claypool Publishers

I happily borrowed the book using the inter-library loan and it traveled for a few days and reached me from somewhere in Lower Saxony to here in Baden-Württemburg. Just imagine, it travelled all the way just for my sake! ;) :P

So, I started to go through the book. I, even in the days of absolute lack of any basic knowledge on this field, always felt that natural language processing should involve some form of linguistic modeling by default. However, most of the successful so-called “language independent” approaches (some of which also became the products we use regularly, like Google Translate and Transliterate) never speak about such linguistic modeling (atleast, not many that I read).

There is also this Norvig vs Chomsky debate, about which I keep getting reminded of when I think of this topic. (Neither of them are wrong in my view but that is not the point here.)

In this context, I found the paper particularly worth sharing. Anyway, I perhaps should end the post. While reading the introductory parts of Emily Bender’s book, I found a reference to the paper, and this blog post came out of that reading experience.

Antonius Block’s questions

On an nth revisit of “The Seventh Seal” film script, I was again rereading the same questions…visualizing the same scene in the movie. This is where Antonius Block asks the entity in the confession box (not knowing that it is “death”), about God. Those haunting questions …

“Call it whatever you like. Is it so cruelly inconceivable to grasp God with the senses? Why should He hide himself in a mist of half-spoken promises and unseen miracles?

How can we have faith in those who believe when we can’t have faith in ourselves? What is going to happen to those of us who want to believe but aren’t able to? And what is to become of those who neither want nor are capable of believing?

Why can’t I kill the God within me? Why does He live on in this painful and humiliating way even though I curse Him and want to tear Him out of my heart? Why, in spite of everything, is He a baffling reality that I can’t shake off?”


Notes from ACL

This is the kind of post that would not interest anyone else except me perhaps. I was at ACL (in a very interesting city called Sofia, the capital of Bulgaria) last week and I am still in the process of making some notes on the papers that interested me, abstracts that raised my curiosity, short and long term interest topics etc. I thought its probably a better idea to arrange atleast the titles in some subgroups and save somewhere so that it would be easy for me to get back later. I did not read all of them completely. Infact, for a few of them, I did not even go beyond the abstract. So, don’t ask me questions. Anyone who is interested in any of these titles can either read them by googling for them or visit the ACL anthology page for ACL’13 and find the pdfs there.

The first two sections below are my current topics of interest. The third one is a general topic of interest. The fourth one includes everything else…that piqued my interest. Fifth section is on teaching CL/NLP…which is also a long term interest topic for me. The final section is about workshops as a whole that I have interest in.


Various dimensions of the notion of text difficulty, readability
* Automatically predicting sentence translation difficulty – Mishra and Bhattacharya
* Automatic detection of deception in child produced speech using syntactic complexity features – Yancheva and Rudzicz
* Simple, readable sub sentences – Klerke and Sogaard
* Improving text simplification language modeling using Unsimplified text data – Kauchak
* Typesetting for improved readability using lexical and syntactic information – Salama et.al.
* What makes writing great?: First experiments on Article quality prediction in the science journalism domain, Louis and Nenkova
* Word surprisal predicts N400 amplitude during reading – Frank et.al.
* An analysis of memory based processing costs using incremental deep syntactic dependency parsing – Schjindel et.al.

Language Learning, Assessment etc.
* Discriminative Approach to fill-in-the-blank quiz generation for language learners
* Modeling child divergences from Adult Grammar with Automatic Error Correction
* Automated collocation suggestion for Japanese second language learners
* Reconstructing an Indo-European family tree from non-native English texts
* Word association profiles and their use for automated scoring of essays -Klebanov and Flor.
* Grammatical error correction using Integer Linear programming
* A learner corpus based approach to verb suggestion for ESL
* Modeling thesis clarity in student essays – Persing & Ng
* Computerized analysis of a verbal fluency test – Szumlanski et.al.
* Exploring word class n-grams to measure language development in children. Ramirez-de-la-Rosa et.al.

NLP for other languages:
* Sorani Kurdish versus Kurmanji Kurdish: An Empirical Comparison – Esmaili and Salavati
* Identifying English and Hungarian light verb constructions: A contrastive approach – Vincze et.al
* Real-world semi-supervised learning of POS taggers for low-resource languages -Garrette et.al.
* Learning to lemmatize Polish noun phrases – Radziszewski
* Sentence level dialect identification in Arabic – Elfardy and Diab

* Exploring Word Order Universals: a probabilisitic graphical model approach – Xia Lu.
* An opensource toolkit for quantitative historical linguists
* SORT: An improved source rewriting tool for improved translation
* unsupervised consonant-vowel prediction over hundreds of languages
* Linguistic models for analyzing and detecting biased language.
* Earlier identification of Epilepsy surgery candidates using natural language processing – Matykiewicz et.al.
* Parallels between linguistics and biology. Chakraborti and Tendulkar
* Analysing lexical consistency in translation – Guillou
* Associative texture is lost in translation – Klebanov and Flor

Teaching CL, NLP:
* Artificial IntelliDance: Teaching Machine learning through choreography, Agarwal and Trainor
* Treebanking for data-driven research in the classroom, Lee et.al.
* Learning computational linguistics through NLP evaluation events: the experience of Russian evaluation initiative. Bonch-Osmolovskaya et.al.
* Teaching the basics of NLP and ML in an introductory course to Information Science. Agarwal.

whole workshops and competitions:
* Shared task on quality estimation in Machine translation
* Predicting and improving textual readability for target reader populations (PITR 2013)

అక్కిరాజు వారి “ఎదుగని బిడ్డ”

edaganibiddaఆ మధ్య అమెరికా దేశంలో కొన్ని రోజులు గడిపినప్పుడు మనసు పాత పత్రికల మీదకి మళ్ళింది (కె.కె.రంగనాథాచార్యులు గారి తొలినాటి తెలుగు కథానికలు: మొదటినుంచి 1930 వరకూ అన్న పుస్తకం చదివిన ప్రభావంలో!). అపుడు చదివిన/చదవాలని పేర్చుకున్న వాటిల్లో నన్ను అమితంగా ఆకర్షించినది “ఎదుగని బిడ్డ” అన్న అక్కిరాజు ఉమాకాంతం గారి కథ. రచనా కాలం – 1914. ఎందుకు నన్ను ఆకట్టుకుందీ అంటే, ప్రధానంగా కథా వస్తువు వల్ల – తెలుగుతల్లి తన బిడ్డ (తెలుగు భాష) కి వచ్చిన రోగం గురించి వాపోవడం ఈ కథలో ముఖ్యాంశం.

“రాజులు విడువగా మంత్రులు, మంత్రులు విడువగా రాజులు బిడ్డను కాలు క్రిందబెట్టనిచ్చినారనుకున్నావా? ఏమి బిడ్డరా, ఏమి బిడ్డరా అని నెత్తినబెట్టుకొననివారు లేరు.” ఇలాగ, తన బిడ్డ పుట్టుకతోనే రాజభోగాలు అనుభవించినప్పటీకీ, “ఏండ్లు పైనబడ్డవి, ఆకారము మారినది. కాని, బిడ్డ ఎదిగినట్లగుపడదు.” …. “ఎవరి ముచ్చట వారు తీర్చుకున్నారే కానీ, బిడ్డ ఎదుగుచున్నదా లేదాయని విచారించినవారు లేరు” – ఇదీ తన బిడ్డ రోగం. ఎదుగక పోవడం! ఎవరూ పట్టించుకోవడం లేదు అని ఆ తల్లి ఆక్రోశం. “నీవేచెప్పు, ఏండ్లేమో పైనిబడె. ముదిరినదన్న ముదరదు. అన్ని ఎదిగితేనె మొగము తగ్గట్లుండి ఇంపూ, సొంపూ …. బిడ్డను చూసుకున్నప్పుడెల్ల నాకడుపు కుమ్మరావమువలె కుమిలిపోవుచున్నది నాయనా! ఏమనుకున్నావో!” అని మనతో వాపోతుంది ఆ తల్లి. ఏమనిచెబుతాము? మనకిమల్లే అప్పటి రాజులకి కూడా వాళ్ళ డెడ్లైన్ల నడుమ పైపైని చూడ్డం కంటే ఎక్కువ సమయం చిక్కలేదేమో! ఎవరొచ్చి ఎవర్ని విమర్శించగలరు!

సరే, ఆ రాజులు పోయారు. ఈ భోగాలు పోయాయి. తురక రాజులొచ్చారు. ఇంత భోగం లేదు. “ఇదేమి బిడ్డరా” అన్నాడట ఒకరాజు. కనుక, బిడ్డని ఇంటికి తెచ్చేసుకుందట ఆ తల్లి, రాజాశ్రయాలు మానిపించేసి. “బిడ్డ వేలుడు కూడ పెరగలేదు. మొహము పెద్దయినది, బట్టతల పడ్డది. కాళ్ళు చెడిపోయినవి. చేతులు మొద్దులైనవి. బిడ్డను చూసిన కొలది గుండె నీరైపోవునే కాని ధైర్యము కలుగదు” – ఆ తల్లిబాధ వింటూంటే, మరి మనకూ ధైర్యము సన్నగిల్లదూ? అంత జీవితం చూసిన ఆ తల్లే తన బిడ్డ గురించి అలాగంటే, బ్రతికినన్నాళ్ళూ ఆ ఎదుగని బిడ్డ తప్ప దాని భోగమేదో ఎరుగని నా బోటి వాళ్ళకి ఏమనిపించాలి! :(

ఆ తరువాత తెల్లరాజులొచ్చారు. వాళ్ళు మంచిరాజులని అందరూ చెబితే, ఆ తల్లి తన బిడ్డ రోగానికి చికిత్స చేయిస్తారని ఆశించింది. మరేం జరిగింది? “పూర్వపు రాసి విని తలయూచినవారొకరు. దూరముగా జూసి బిడ్డపై యొక కాసు, రెండు కాసులు పడవేసినవారొకరు. పాపము దలచినవారొకరు. మొహము చిట్లించుకున్నవారొకరు. ఎత్తుకున్నవారు లేరు. చంకనుబెట్టుకున్న వారు లేరు. ఎందుకు నాయనా భ్రమ? బిడ్డకు వెనుకటి రోజులు తిరిగి రావు. … నిజమున కేమి? బిడ్డ ఏమంత శృంగారముగా ఉన్నదని నెత్తిన బెట్టుకుందురు నాయనా ఇతరులు, నా యేడుపే కాని!” – ఏమి చెప్పాలో తోచింది కాదు నాకు ఇలా వాపోతూంటే. బిడ్డని నేను చూసినప్పటి నుండి అట్లే ఉంది. మరో బిడ్డ ఎలా ఉంటదో నాకు తెలియదు మరి. ఏదో అందం? ఏది అనాకరం? నాకెలా తెలుస్తుందండీ? అందుకని మౌనంగా ఉండిపోయాను. పైగా, ఈ బిడ్డ తరువాత పుట్టిన బిడ్డలందరూ వాళ్ళ తల్లుల కడుపు చల్లగా, కళకళలాడుతున్నారట. పేరు, ప్రతిష్ట, సిరిసంపదలు – అన్నీ సంపాదిస్తున్నారట. వీరి మధ్య, ఆ తల్లి depression ని అర్థం చేసుకొనువారెవరు? care for the care-giver అన్న అంశం గురించిన ఎరుక ఉన్నవారెవరు? (అ తల్లి కి ఇతరత్రా బాధలు కూడా ఉన్నవి కదా అసలుకే ఇప్పుడు!)

“భోగభాగ్యాలు, కీర్తి ప్రతిష్టలు లేకపోగా, అన్నమునకే అగచాట్లు పడుచున్నది. అనగూడదు గాని నాయనా! చచ్చినదానిలోను, బ్రతికినదానిలోను జమకాకున్నది” అని ఏడుస్తూనే, వైద్యులేమన్నారో చెప్పిందావిడ – “రాజుల ఇండ్లలో చిన్నతనమునే తినరానిదెల్ల తినుటవలన బిడ్డకు పొట్టపాడైనది. ఇక పెరుగదు గాని బ్రతుకును. అని కొందరోదార్చిరి.” అన్నారట. తెల్లవైద్యము నేర్చిన మనవారేమో – “ఈతల, ఈకాళ్ళు, ఈ చేతులు, ఈ పొట్ట తీసివేసి” కొత్తవి వేయాలని అన్నారట. ఒక పక్కన ఇవన్నీ చేస్తే, ఈ మాత్రమన్నా బిడ్డ మిగలడేమో అన్న బెంగ, ఒక పక్క ఏమో, బిడ్డ బాగుపడతాడేమో అన్న ఆశ! ఏమి చేయాలి? అని ఆ తల్లి బాధ.

ఏమి చెప్పాలి? ఉన్నట్లుండి ఆక్సిడెంటులో కుటుంబపెద్ద పోతే, “మాకే ఎందుకిలా జరగాలి” అని ఆ కుటుంబ సభ్యులడిగితే సమాధానం చెప్పగలమా? లేకలేక పుట్టిన పిల్లకి చిన్నప్పటినుంచే ఏదో రోగం ఉన్నదనీ తెలిస్తే ఆ తల్లిదండ్రులు “ఎందుకిలా జరిగింది?” అని అడిగితే సమాధానం ఇవ్వగలమా? ఆ తల్లి హిందూ ధర్మానుయాయి అయిన పక్షంలో “కర్మ” అనుకొనాలి. కాని పక్షంలో ఏమి చేసుకోవాలో? కొంచెం ఫ్యాషనుగా, “లక్” అనుకొనాలి కాబోలు. లేకపోతే, – “lack of vision” అనుకోవాలి. మరి ఎందుకు అది లేదంటే మళ్ళీ ఏమనుకోవాలి? ఎందుకు ఉండాలంటేనో? ఒకదాని వెంబడి ఒక ప్రశ్న ఇలాగ వస్తూనే ఉంటాయి. ఒక్కో ప్రశ్నకీ వీటి నుండి ఒక్కో జవాబు ఎంచుకుంటూ, చక్రభ్రమణం చేసుకుంటూ ముందుకు సాగిపోవాలి కాబోలు, భూమి తనచుట్టూ తాను తిరుగుతూనే సూర్యుని చుట్టూ కూడా తిరుగుతున్నట్లు! భూమి ఎందుకు తిరగాలి అసలు? – మళ్ళీ ప్రశ్న!

(ఉమాకాంతం గారు భాష రాసే పద్ధతి కొంచెం విచిత్రంగా అనిపిస్తుంది నాకు. నాకు అలా టైపు చేయడం కొంచెం కష్టంగా ఉంది. అందువల్ల, సమయాభావం వల్ల, మామూలుగా టైపు చేశాను ఆ కథలోని వాక్యాలని.)

కథను చదవాలి అనుకుంటే, ప్రెస్ అకాడెమీ ఆర్కైవులలో (త్రిలింగ మాసపత్రిక, మే 1914 సంచిక, 14-18 పేజీలు) వెదుక్కోవచ్చు, లేదంటే, ఫేస్బుక్ “కథ” గ్రూపులో ఇక్కడ చదువవచ్చు.

శ్రీపాద వారికి అన్నగారి సలహా

శ్రీపాద వారికి వారి పెద్దన్న గారు ఇచ్చిన సలహా ఇది. అదివరలో చదివినప్పుడు ఆట్టే గమనించని కొన్ని ఇప్పుడు ప్రస్ఫుటంగా కనిపిస్తున్నాయి నాకీ పుస్తకంలో. నా విషయంలో ఇలా జరగలేదు కానీ, ఈ విషయం ఆలోచించదగ్గది!

“..గుణదోషాల సంగతి అలా ఉంచు. ఆ పద్యాల బంధం వదులు వదులుగా వుంది గాని బిగువుగా లేదు. ఆదిలోనే అలాంటి తేలిక పుస్తకాలు చదివితే సాహిత్యంలో మంచి ప్రవేశమూ కలుగదు, సరి అయిన రుచీ ఏర్పడదు. కనక ముందు నన్నయ భారతం చదువు. తరవాత మొదటి మూడాశ్వాసాలూ మనుచరిత్ర చదువు. అలాగే పారిజాతాపహరణమున్నూ పూర్వార్థం చదువు. తరవాత శృంగార నైషధం తప్పకుండా చదువు. దాంతో, సరిగా అవి అర్థం అయినా కాకపోయినా, గంభీర రచనలమీద నీకు ఆదరభావం కలుగుతుంది, దృఢపడుతుంది. అప్పుడు అర్థం సాధించాలన్న దీక్ష దానంతట అదే పుడుతుంది. పద్యబంధంలో వుండే బిగువు బోధపడుతుంది. ఆ వరసనే తిక్కన్న భారతం చదవాలి. తెలుగులో నీకు మంచి అభిరుచీ, సాహిత్యమూ కలగాలంటే యిది సరియైన పాఠ్యక్రమం”

శ్రీపాద రచనా దాహం గురించి

చాన్నాళ్ళకి మళ్ళీ శ్రీపాద వారి ఆత్మకథ చదవడం మొదలుపెట్టాను. ఈసారి, ఆయనకి కథారచన చేయాలన్న కోరిక చిన్ననాడు ఎంతబలంగా ఉండేదో వర్ణించిన భాగం మళ్ళీ మళ్ళీ చదువుకున్నాను. అందుకని, ఇక్కడ టైపు చేసుకుంటున్నాను.


…ఇంత కార్యక్రమంలోనూ, మధ్యాహ్నం చెప్పుకున్న కొత్త పాఠం వల్లించుకోడం తడువుగా ఎగిరిపోయి దేవాలయ గోపురం పైఅంతస్థున కూచునేవాణ్ణి, ఏమిటేమిటో కలలు కంటూ నేను.

నాకు జ్ఞాపకం వుండినంత వరకూ, ప్రయత్నపూర్వకంగా నేను కల్పనకు పూనుకోడానికి మొదలు ఆ గోపురం మీదే.

అక్కణ్ణుంచి చూస్తే, ఎదట, వరసగా, విరగబూసిన బొగడచెట్ల శిఖరాలు – ఎడమవైపున ముడుచుపోయిన కలవలతో నిండివున్న కోనేరు – వెనక, చిరుగంటలతో ధ్వజస్తంభాగ్రమూ మిలమిల మెరిసే పసిడికుండతో దేవాలయ శిఖరమూను – కుడివైపున, చేతికందేటట్టు మనిషి కలవిగాని గెలలతో కొబ్బరిచెట్ల తలలు – ఇలాగ, ఆ పరిసరాలందుకనుకూలంగానే ఉండేవి.

దీనికి సాయం అక్కడ నాలుగువైపుల నుంచీ కమ్మని గాలి రివ్వున కొట్టేది, మధ్యమధ్యమాత్రం గబ్బిలాల కంపుతో కలుషితం అయిపోతూ.

అయితే, భాష రాదు, అనుభవం లేదు, భావాలు పుట్టవు. అయినా, వినిఉండిన కొద్ది కథలూ ఆధారంగా, చక్కని కథలు కల్పించాలనీ, రసవంతంగా చెప్పాలనీ సంకల్పమూ, మొదటి ప్రయత్నమూ కూడా అక్కడే నాకు.

వల్లూరిలో నేను పడ్డ మరోప్రపంచంలో, మళ్ళీ నాకిది యింకో ప్రపంచం.

నేను లేశమూ సంస్కారం లేనివాణ్ణే అయినా, ఆ ప్రపంచ స్వభావం అది కనక, అందులో పడ్డ వెంటనే నిర్థారణ చెయ్యలేని ఆవేశం యేదో తలముంకలయి పరవశుణ్ణి చేసేసేది నన్నుతరక్షణంలో.

అందువల్ల గోపురం దిగడం అంటే నాకెంతో బాధగా ఉండేది.

… … …

అది రచనాకాదు, రచనాసమాధి అసలే కాదు. సమాధి అంటే యేమిటో ముక్కూ మొహమూ కూడా నాకప్పుడేమీ తెలియదు – అయినా, సగంలో లేచి రావడం అంటే అప్పటికే నాకు బాధగా ఉండేది.


పి.బి.శ్రీనివాస్ ఉదయం – ఈమాట.కాం వల్ల!

నిన్నటి ఉదయం అంతా ఈమాట పత్రికలో పి.బి.శ్రీనివాస్ గారిపై వచ్చిన వ్యాసాలు చదువుతూ, వారి పాటలు వింటూ గడిచింది. అక్కడికి నేను ఏదో ఆయన వీరాభిమానిని అనుకునేరు. ఏదో, అందరి పాటలు వింటూనే ఆయనవీ వినడమే గానీ, ఆయన రంగు రంగుల పెన్నులు పెట్టుకుంటారు, జరీ తలపాగా ధరిస్తారు, పలు భాషల్లో నిష్ణాతుడు, వాళ్ళ మనవడు బాలనటుడిగా చేశాడు అన్నవి తప్పిస్తే నాకు ఆయన గురించి ఏమీ తెలియదు. ఈమాట.కాం వెబ్ పత్రిక వారు ఈ నెల సంచికలో పి.బి.ఎస్. గురించి ప్రత్యేక వ్యాసాలు, పి.బి.ఎస్. స్వయంగా రాసిన వ్యాసాలు చేర్చడం తో, నేను ఆసక్తిగా చదవడం మొదలుపెట్టాను.

ఇవిగో ఆ వ్యాసాలు:

1. ప్లే బ్యాక్ సింగర్ పి.బి.ఎస్ అని – విష్ణుభొట్ల లక్ష్మన్న, జెజ్జాల కృష్ణమోహన రావు, పరుచూరి శ్రీనివాస్ గార్లు రాసిన వ్యాసం : ఇందులో ఒక యాభై పాటలకన్నా లంకెలు ఉండి ఉంటాయి … నాలుగైదు భాషల నుండి. చాలామట్టుకు వాటి గురించిన వివరాలు కూడా జతచేశారు. చాలా తక్కువ వ్యవధిలో (కళ్ళుతిరిగేలా) బోలెడు పాటల వివరాలతో కూర్చిన వ్యాసం ఇది. ఈ వ్యాసం చదువుతూ, ఆ పాటలు వింటూ పూర్తి చేయాలంటే ఒక నాలుగైదు గంటలు పట్టొచ్చు కనుక, వ్యాసం చదువబోయేవారు దానికి సిద్ధం కండి.

2. సంగీత సాహిత్య శ్రీనివాసుడు - ఏల్చూరి మురళీధరరావు గారి వ్యాసం: చదవగానే… “వావ్!” అనుకున్నా. పి.బి.ఎస్. లోని మేధావి ని పరిచయం చేసిన వ్యాసం… నాకు మొత్తం అర్థమైపోయిందని చెప్పలేను కానీ, ఇది మాత్రం అద్భుతమైన వ్యాసం. బహుశా, నేను మళ్ళీ వచ్చి మళ్ళీ మళ్ళీ చదవబోయే వ్యాసం అనుకుంటున్నాను.

3. హాయిగా పాడుదునా – సాలూరి రాజేశ్వర రావు పై పి.బి.ఎస్. విజయచిత్రలో 60లలో రాసిన వ్యాసం. ఆసక్తికరంగా ఉంది. పి.బి.ఎస్. ఆట్టే క్లిష్టత లేకుండా, మానవభాషలో రాశారు కనుక నా బోంట్లకి కూడా అర్థమైపోయిందని సంతోషం!

4. చలనచిత్ర సంగీత సాహిత్య పోకడలు – మరో పి.బి.ఎస్. వ్యాసం. ఇది కూడా ఆసక్తికరంగా చదివించింది.

- ఆ విధంగా, నా శనివారం ఉదయాన్ని పి.బి.ఎస్., ఈమాట ఆక్రమించారు. నేను ఆరింటికేమో మొదలుపెట్టి, ఈ కార్యక్రమం ముగించుకుని తల తిప్పేసరికి 12 కావొస్తోందని గ్రహించా! :P ఈ మధ్య కాలంలో తెలుగు, అందునా పత్రికలు, అందునా ఈమాట జోలికి అసలు వెళ్ళలేదు కనుక, నా స్థాయికి ఇది రికార్డే అనిపించి, ఇలా బ్లాగు రాసుకుంటున్నా :-)

వంశవృక్షం (తెలుగు) సినిమా నుండి ఒక సంభాషణ

సంక్రాంతి దాకా ఏవీ రాయకూడదనే అనుకున్నా కానీ, ఎస్.ఎల్.భైరప్ప గారి నవల వంశవృక్ష ఆంగ్లానువాదం, తరువాత వంశవృక్షం తెలుగు సినిమా వెండితెర నవల, తరువాత వంశవృక్ష కన్నడ సినిమాలో కొన్ని భాగాలూ – అన్నీ చూశాక ఒకే దృశ్యం అన్నింటిలోనూ గొప్పగా ఉన్నట్లు తోచింది. పదే పదే గుర్తొచ్చింది. అది సరస్వతి తన మామగారిని – “నా కొడుకు ను నాతో పంపేయండి” అని అడిగే దృశ్యం. (నవల, సినిమా (ముఖ్యంగా తెలుగు వర్షన్) రెండింటి మధ్య చాలా తేడాలున్నాయి కానీ, ఈ ఒక్క దృశ్యం విషయంలో మాత్రం ఒకదాన్ని మించి ఒకటి ఉన్నట్లు తోచాయి నాకు.)

దానితో, తెలుగు వెండితెర నవల (సినిమాకి: నవలీకరణ – శ్రీరమణ; సంభాషణలు – ముళ్ళపూడి వెంకటరమణ) లోని ఈ భాగాన్ని టైపు చేస్తున్నా. ఇది కాపీరైట్ ఉల్లంఘన అయిన పక్షంలో తెలియజేయగలరు. ఇక, ఈ అంశంపై అనేక వాదోపవాదాలు – వ్యతిరేక దృక్కోణాలు ఉండడం సహజం. అయితే, ఆ వాదోపవాదాలలో మాత్రం నేను పాల్గొనను అని ముందే మనవి చేసుకుంటున్నాను.


“మావగారూ! గోదావరికి మనమెంత పాత్ర తీసుకెళితే అంతే నీరు దక్కుతుందని మీరు నాకోసారి చెప్పారు”
ఆచార్యులవారు ఆమె జవాబుకి నివ్వెరపోయి చూశారు.

“కఠినంగా మాట్లాడాను. మన్నించండి.” మామగారి నివ్వెరపాటు గమనించిన సరస్వతి అంది.

“తప్పేమీ లేదమ్మా. నేను తీసుకువెళ్ళిన పాత్రలో ఈ ఫలం తప్పకుండా వుందని నాకు నమ్మకం ఉంది. చూడమ్మా – సృష్టికి క్షేత్రం, బీజం రెండూ అవసరమే. అయినా, జన్మించే మొక్క బీజాన్ని బట్టి ఉంటుంది. వరి నాటికే పుట్టే మొక్కను వరిమొక్కే అంటారు గానీ గోధుమ అనరు. క్షేత్రం పేరు చెప్పుకోరు. మా అబ్బాయి మాధవుడు మా యింటివాడు. వాడి బిడ్డ వాడి యింటికి చెందుతాడు. బిడ్డలెపుడు తల్లికిగాని, తండ్రికిగాని చెందరు. వారు కుటుంబం ఆస్తి. నువ్వు కుటుంబంలో భాగంగా ఉంటే ఆ బిడ్డపై నీకు సర్వాధికారాలు ఉంటాయి. నువ్వు కుటుంబాన్ని కాదని అలా వెళ్ళినపుడు – ఆ బిడ్డని వాడి ఆస్తిని ఇంకో ఇంటికి తీసుకెళ్ళే హక్కు నీకు లేదు. “

ఆచార్యులవారు ఆస్తి అనగానే సరస్వతి ఒక్కసారి తలెత్తి “నాకా ఆస్తి వద్దని ముందే చెప్పాను” అన్నది తీవ్రంగా. ఆచార్యుల వారు గంభీర వదనంతో -
“నీకలా చెప్పే అధికారం లేదు. నీ బతుకు నువ్వు దిద్దుకున్నట్టే వాడి బతుకు వాడూ దిద్దుకుంటాడు. వాడికా జ్ఞానం వచ్చేవరకూ వాడు పుట్టినచోట వాడికి లభించే సంస్కారం, చదువు, సంప్రదాయంతో పాటు వాడికి గల ఆస్తిని కూడా కాపాడి వప్పజెప్పడం కన్నవాళ్ళ ధర్మం. రేపు వాడు పెద్దవాడయ్యాక నా ఆస్తిని ఎందుకు వదిలేశావని నిన్ను అడిగితే…? నా చదువు సంస్కారాలను నాకు తెలీని స్థితిలో ఎందుకు మార్చావని అడిగితే…? నీ మీద కోపిస్తే …? నిన్ను ద్వేషిస్తే ..?”

ఆయన మాటలకు సరస్వతి నివ్వెరపోయింది. ఆచార్యులవారు విశ్వవిరాట్ రూపంలా ఉన్నారు. భయపడుతూ చేతులు జోడించి, మెల్లగా లేచి నిలబడింది సరస్వతి. ఆయన ప్రశాంతంగా చూశి మందహాసం చేశారు.

“అమ్మా, సరస్వతీ! కలవరపడకు – ధర్మమీమాంస వద్దన్నావు కాబట్టి సాధక బాధకాలు మట్టుకే చెప్పాను. నీ బిడ్డను లాక్కుపోయే అధికారం నీకు లేనట్టే, తీసుకుని దానమిచ్చే అధికారం నాకూ లేదు. చెట్టులోని ఓ కొమ్మ ఓ రెమ్మని దానమివ్వలేదు. కాని ధర్మం వేరు – చట్టం వేరు. చట్టప్రకారం తల్లిగా నీ బిడ్డను తీసుకువెళ్ళే హక్కులు నీకే ఉంటాయి. వాటికోసం నేను కోర్టుకు వెళ్ళి నా వంశగౌరవాన్ని రచ్చకెక్కించను. అంతేగాదు – నా వంశం నిలబెట్టడం కోసం బిడ్డని దానమిమ్మని యాచించను. నా మీద, లోపల ఏడుస్తున్న ముసలిదానిమీద జాలిపడమని అర్థించను. నా యింటి దీపం ఆరిపోతే, నా బతుకు చీకటవుతుంది కానీ, లోకం చీకటవదు”


The Word and the World – 6 (తాత్కాలిక విరామం)

(ఈ టపాలు ఈ పుస్తకం గురించి నేను రాసుకుంటున్న నోట్సు. ఈ సిరీస్ లో తక్కిన టపాలు ఇక్కడ.)

Chapter-5: The Karaka Theory
ఈ కారక సిద్ధాంతం గురించి ఇదివరలో మా కంప్యుటేషనల్ లింగ్విస్టిక్స్ పరిచయ క్లాసుల్లో విన్నందువల్ల – అదేమిటో – నాకు అర్థమైనంతలో చెప్పే ప్రయత్నం చేస్తాను – ఒక వాక్యంలో క్రియ మూలపదం అనుకుంటే, దానితో ఇతర పదాలకి ఉండే అనుబంధాన్ని “Karaka roles” సహాయంతో నిర్వచించవచ్చు. ఇవి ఆరుంటాయి – అపాదాన, సంప్రదాన, కారణ, అధికరణ, కర్మన్, కర్త.  ఈ సిద్ధాంతం ఈ రోల్స్ ఎలా ఇస్తారు? దాన్ని వ్యాకరణానికి ఎలా ఉపయోగించుకోవచ్చు అన్నవాటి గురించి.

వీటి గురించి సాంకేతికుడి కోణంలో ఒక చర్చకి NLP-A Paninian Perspective అన్న ఈ-పుస్తకం చూడండి. ఇక పుస్తకంలో ఈ అధ్యాయానికి వచ్చేస్తే -

G.Cardona అన్న ఇండాలజిస్టు అభిప్రాయం ప్రకారం ఈ కారక సిద్ధాంతం – ‘basis to Panini’s derivational system.’

W.D.Whitney అన్న మరొక భాషావేత్త ప్రకారం ఈ సిద్ధాంతం – ‘a reflection of case form’ మాత్రమే.
-అయితే, అపాదాన-సంప్రదాన అన్నవి రెండూ ablative-dative లను పోలి ఉన్న మాట నిజమే అయినా, ఈపోలిక ఉన్నంతమాత్రాన Whitney ప్రతిపాదనను తాను అంగీకరించలేనంటారు రచయిత. (నిజానికి, మాకు కారక గురించి చెప్పినప్పుడు విచిత్రంగా ఈ కేస్ సిద్ధాంతాలకి సంబంధించిన Thematic Role అన్న అంశాన్నే ఉదాహరణలు గా తీసుకుని వివరించారు అని గుర్తు. :-) బహుశా బొత్తిగా వీటి గురించి పరిచయం లేని వారికి, పాశ్చాత్యుల టర్మినాలజీతో పరిచయం ఉండేవారికీ అలాగే చెప్పాలేమో! వీటి గురించి నాకు అంత గొప్ప సైద్ధాంతిక అవగాహన లేదు, ప్రాథమిక పరిజ్ఞానం తప్ప. కానీ, 1960లలో కి వచ్చేదాకా పాశ్చాత్యులు రూపొందించని ఈ సిద్ధాంతాలని మన భాషావేత్తలు ఎప్పుడో పురాతన కాలంలోనే అంత వివరంగా డాక్యుమెంట్ చేసారంటే నాకు ఆశ్చర్యంగానే ఉంది!)

“After applying the Karaka categorization rules to classify items, it becomes easy to formulate grammatical rules which introduce affixes to such items based upon such conditions. An object(karman), for example takes the -am suffix .. .. and an instrument takes the -ta affix… “
(ఈ అంశం గురించిన సుదీర్ఘ చర్చ కూడా పైన లింక్ చేసిన – NLP-A Paninian Perspective పుస్తకంలో ఉంది.)

ఈ కారక సిద్ధాంతం గురించే, Panini కాక ఇతర భారతీయ భాషావేత్తలు కూడా వివరంగా వ్రాసారు. ప్రధానంగా భర్తృహరి మీద ఫోకస్ చేస్తూ, కారక సిద్ధాంతాన్ని అర్థమయ్యే భాషలోనే వివరించిన ఒక వ్యాసం ఇక్కడ చదవండి.

రచయిత రాసిన ఈ వాక్యాలు నాకు బాగా నచ్చాయి.
“It is well known that Panini and the Paniniyas were Sabdapramanikah, those who regard speech patterns as authority. Patanjali has said (which has often been quoted): ‘we accept the authority of the speech. What speech tells us is what we depend upon (for deciding issues)’. This, I believe, means that we should put stress on the point that grammar is not concerned with ontology (or semantics, i.e, things and events) but with what people actually say, or rather how people speak of things and events. Paninin’s Karaka categories fit in well with this point and hence we can easily account for such usages as ‘sthali pachati’, ‘the cauldron cooks’, although we know very well that the cauldron is the substrate where cooking takes place, not the agent of cooking. But philosophically, one can think of the cauldron as a contributing factor to the action of cooking and some agency may be attributed to it.”

3. అసలు “కారక” అన్న దానికి సరైన నిర్వచనం ఏమిటి? అని వివిధ శాఖల మధ్య వాదోపవాదాలు జరిగాయట. వీటిల్లో రెండు ప్రధానమైన నిర్వచనాలు ఉన్నాయి – ఒకటి kriyanimitta – causal factor of an action/verb, రెండవది – Kriyanvayin -syntactically connected withaction/verb kriya” – ఇలాగే ఈ కరక గురించి వాదోపవాదాలు చాలా కాలం కొనసాగాక –

“What is Karaka? అన్న ప్రశ్నకి పదిహేను-పదహారో శతాబ్దపు నవ్య నైయాయికులు ఒక పరిష్కారం సూచించారు. రచయిత మాటల్లో -
“Bhavananda says that a Karaka, both in its principal sense and its secondary sense, is to be defined as that which is syntactically connected (anvayin) with the action verb through the intermediary of the meaning of vibhaktis (the so-called case-affixes). It is clear here that the karaka categories are intermediaries between the semantic interpretation and grammatical suffixes.
… …
Thus, Bhavananda at the end says that the correct definition would be as follows. A Karaka is what is syntactically connected with the action verb (anvita) and is endowed with any one of the six properties or powers: agenthood, objecthood, instrumentality, recipienthood, apadanatva ‘being fixed point of departure’ and locushood.”

-ఇదీ విషయం.
(ఈ వ్యాసమంతా philosophical కోణంలో సాగింది కానీ, నిజజీవితంలో, కంప్యూటర్ సైన్సు వాళ్ళు కారక సిద్ధాంతాన్ని ఎలా ఉపయోగించాలి అనుకుంటున్నారో, ఉపయోగిస్తున్నారో తెలుసుకోవాలంటే మాత్రం పైన లంకె ఇచ్చిన NLP-A Paninian Perspective మంచి స్టార్టింగ్ పాయింట్ అని నా అభిప్రాయం. Karaka Natural language processing ఇలాంటి క్వెరీలతో శోధనాయంత్రాల్లో వెదికితే, ఈమధ్య కాలంలో వచ్చిన రిసర్చి పేపర్లు గట్రా కనబడతాయి. ఇంకా మీకేవన్నా ఆసక్తికరమైన లంకెలు కనిపిస్తే – వ్యాఖ్యలలో తెలియజేయండి.)

(మళ్ళీ ఈ వ్యాసాలను సంక్రాంతి తరువాత కొనసాగిస్తాను.)

