DLI డిగ్గింగ్ లో నా అనుభవాలు

డీఎల్లై ప్రాజెక్టు గురించి మొదట తెలిసింది 2007 మొదట్లో. అప్పటికి ఎన్నాళ్ళుగా ఇది ఉందో తెలీదు కానీ, అప్పట్లో ట్రిప్లైటీలో మెగా స్కానింగ్ సెంటర్ని చూస్తూ, ఏం చేస్తారో అన్ని స్కాన్లు – అనుకుంటూ ఉండటం గుర్తుంది. మొత్తానికి సైటు తెరిచాక, అబ్బో! చాలా పుస్తకాలున్నాయంట గదా – అనుకుని చూస్తే ఏముందీ? అదొక భయంకరమైన సెర్చ్ ఇంటర్ఫేస్. సుబ్రమణ్య అనడానికి “subrahmand-ya” అనాలనీ, రామకృష్ణ కు “raamakrxshhnd-a”, మామిడిపూడికి ” maamid’ipuud’i” – ఇలా ఉండేసరికి విసుగొచ్చింది. అన్నింటికంటే చిర్రెత్తించే విషయాలేంటంటే :

– ఒకే పేరు ఐదారు రకాలుగా రాస్తారు (UTUKURI LAXMIKANTAMMA,  UTUKURI LAKSHMI KANTHAMMA,UVTUKURI LAXMIKANTHAMMA, Utukoori Lakshmi Kantamma, Utukumari Lakshmi Kantamma,Uturilakshmi Kantamma)
-ఎక్కడా ఒక మ్యాపింగ్ వంటివి ఉండవు. (వాళ్ళే అన్ని రకాలుగా రాస్తే, మనమేం పెట్టుకు వెదుకుతాం లెండి అయినా)
-ఇక చదవడానికి : ఆన్లైన్లో టిఫ్ ఫార్మాట్ వంటి వాటిల్లో ఉంటాయి. ఒక్కోపేజీ దిగుమతి చేస్కుని చదవాలన్నమాట.

వీటిల్లో చివరి పాయింటుకి ’భువనవిజయం’ బ్లాగర్ షణ్ముగన్ గారు ఒక టూల్ రాసారు. దాని ద్వారా డీఎల్లై పుస్తకాలు పీడీఎఫ్ కి మార్చుకోవచ్చు. ప్రస్తుతం ఉన్నంతలో ఇదే ’ది బెస్ట్’ సొల్యూషన్ అనుకుంటాను. ఇది ఉన్న విషయంగానీ తెలియకుంటే, నేనీ జన్మకి డీఎల్లై మొహం చూసేదాన్ని కాదు. అక్కడున్న నిధి ఎప్పటికీ తెలిసేది కాదు. దానికి ఆయనకి చాలా రుణపడి ఉంటాను. నాతోసహా చాలామంది ఇదే భావనలో ఉండి ఉంటార్లెండి.
సరే, ఇంతకీ ఇది ’అందీ అందక, తెలిసీ తెలియక, ఉండీ ఉండక..’ అన్న చందంగా…అడవి కాచిన వెన్నెల్లా తయారవడానికి కారణం ఏమిటి? అన్న విషయం పక్కన పడితే – ఈమధ్య నేనిలా డీఎల్లై గురించి కనబడ్డ వారందరికి సుత్తేస్తూ ఉంటే – నువ్వు ఎలా వెదుక్కుంటున్నావో ఒక టపాలో రాస్తే బాగుంటుందని సలహా ఇచ్చారు 🙂 [పాపం నన్ను భరించలేక… అని కూడా అనుకోవచ్చు. హీహీ]

నేను ఎలా వెదుక్కుంటున్నాను అన్నది ఇలా రాస్కుంటే, మళ్ళీ రెండుమూడేళ్ళ తరువాత నాకూ చదూకోడానికి పనికొస్తుంది కదా – అని రాస్తున్నా అనమాట.

మొదట- అన్నింటి కంటే ముఖ్యంగా ఓపిక కావాలి. చెప్పాను కదా :  ఊటుకూరి లక్ష్మీకాంతమ్మ గారి పేరుకి ఎన్ని రూపాలున్నాయో… (ఇంకా ఒకట్రెండు రూపాలున్నాయనుకుంటా). నేను “kantamma”, “kaantamma” – ఇలాంటి క్వెరీలతో మొదలుపెడతాను. నేను గమనించినంతలో, డీఎల్లై వారు త కి “th” వాడ్డం చాలా తక్కువ. కనుక, “కాంతమ్మ” కి పై రెండు స్పెల్లింగులు తప్ప మరోటి ఉండే అవకాశం లేదు. ఇవి వెదికితే, నలుగురైదురు కాంతమ్మలొస్తారు కదా. వారిలో ఎలాగో మన కాంతమ్మగారుంటారు. అసలు ఇంకా తెలివిగా ఆలొచించి… “kanta”, “kaanta”  (Author Field లో) అని కొడితే, ఇంకో నలుగురైదుగురు రచయితల స్పెల్లింగులు కూడా తెలుస్తాయి.

Pingali Lakshmikantham : ఎంత స్ట్రైట్ ఫార్వర్డ్ గా ఉందీ స్పెల్లింగ్, అని మురిసిపోయారా పింగళి లక్ష్మీకాంతం పేరు దొరగ్గానే. నేనూ అలాగే మురిసిపోయా. తరువాత మరేదో చూస్తున్నప్పుడు (ఆరుద్ర అని కొట్టినప్పుడు రామలక్ష్మి ఆరుద్ర గారి పేరు కనబడ్డప్పుడు అనుకుంటా) బల్బ్ వెలిగి – “laqs-mi” అని క్వెరీ ఇచ్చా. ఇక చూడండీ –  pin’gal’i laqs-mikaan’tan’ (పింగళి లక్ష్మీకాంతం), ke,raamalaqs-mi (కె.రామలక్ష్మి), shrii chilakamarti laqs-miinarasin’han’ (చిలకమర్తి లక్ష్మీనరసింహం),  pi laqs-miikaan’tan’ shreishht’hi (పి. లక్ష్మీకాంత శ్రేష్టి),  jan’dhyaala laqs-miinaaraayand-a shaastri (జంధ్యాల లక్ష్మీనారాయణ శాస్త్రి??),  vuyyaaru laqs-miinarasin’haaraavu (ఉయ్యారు లక్ష్మీనరసింహరావు),  : ఇలా ఏవేవో ఒక ఇరవై ముప్ఫై పేర్ల పైనే ఉంటాయి.
– ఇక్కడ్నుంచి నాలాంటి వాళ్ళకి కొత్త ప్రపంచం ఆవిష్కృతమౌతుంది. ఇలా ఈ ముప్ఫై పేర్లు, వీటితో పాటు ఒక అరవై డెబ్భై పుస్తకాల పేర్లూ : జాబితా వస్తుందా? అక్కడ్నుంచి ద్విగుణీకృత ఉత్సాహంతో అన్వేషణ మొదలు. ఎలాగంటారా? కొన్ని పేర్లు ఎలా కొట్టాలో తెలుస్తుంది కదా. ఏ శాస్త్రి, లక్ష్మి వంటి కామన్ పేరో తీసుకుని, వచ్చిన యాభై ఫలితాల్లో మనక్కావాల్సిన వాళ్ళని వెదుక్కోవచ్చు.

అలాగే, ఉదాహరణకి, నాకు శ్రీపాద వారి కథలు కావాలనుకోండి, ఎంతైనా, మీరు “shriipaada subrahmand-yashaastri” అని కనిపెట్టగలరా? నేనైతే, ’kathalu’ అని వెదుకుతా. అప్పుడు మల్టీ పర్పస్ గా, మల్లాది వారు, కుటుంబరావు గారు – ఇలా ఎందరెందరివో కథలు కూడా దొరుకుతాయి. అలాగే, “patrika”, “sanchika” ఇలాంటి క్వెరీలిచ్చి -ప్రత్యేక సంచికలూ గట్రా ఏవన్నా ఉంటే వెదుక్కోవచ్చు. ఇందాకన్నట్లు – సగం పేర్లిచ్చి వెదుక్కుంటే, మనక్కావల్సిన వాళ్ళే కాక, కావాల్సి, సమయానికి గుర్తురాని వాళ్ళు కూడా దొరుకుతారు.

దాశరథి కృష్ణమాచార్య రచనలు వెదకడం కోసం నేను రంగ (ranga) అని కొట్టి వెదికాను. దాశరథి రంగాచార్య దొరికితే, డీఎల్లైలో దాశరథి స్పెల్లింగెలా రాసారో తెలుస్తుంది కదా అని. రంగ అన్నదాన్ని ’ranga’ అనో, మరీ అతికి పోతే ’ran’ga’ అనో తప్ప రాయలేరు కదా… కనుక, ఆయన పేర్రావడం గ్యారంటీ అని అనమాట (కొంచెం అతితెలివే అనుకోండి… ;)). ఇలా సాగింది నా డీఎల్లై డిగ్గింగ్.

“rama”, “raama” అన్న క్వెరీలకి వచ్చిన ఫలితాల నుండి కూడా చాలా పుస్తకాల వివరాలు తెలిసాయి. ఇలా అలవాటు పడ్డాక, కొన్ని మ్యాపింగులు అర్థమైపోతాయి. అప్పుడు కొంత తేలికవ్వొచ్చు వెదుకులాట. ఉదాహరణకు.. “వివేచన” అను “viveichana” అని వెదకాలనీ, లక్ష్మి కి “laqs-mi” అని కూడా వెదకాలనీ – ఇలాంటి “రూల్స్” కొన్ని అర్థమైపోయాయంటే, ఇక ఆటలో ఓటమి ఎదురయ్యే అవకాశాలు తక్కువ.

నిజం, మంచి గేమ్. అదొక రకం దాగుడుమూతలాట – పుస్తకాలతో. మెదడుకు అక్షరాల మేత కోసం, అక్షరాలతో కుస్తీ పట్టడం ఇలాగే ఉంటుంది మరి.

నాలాంటి Lazy fellows కి గుణపాఠం నేర్పేందుకే జానపదకథల్లో నిధులని కాపలా కాసే ప్రమాదకరమైన పాముల్లా, ఇలాంటి ఒక ఇంటర్ఫేస్ సృష్టించి పెట్టిన డీఎల్లై వారికి ధన్యవాదాలు.

Published in: on March 24, 2010 at 8:37 am  Comments (12)  

The URI to TrackBack this entry is: https://vbsowmya.wordpress.com/2010/03/24/dli-experiences/trackback/

RSS feed for comments on this post.

12 CommentsLeave a comment

  1. మంచి సమాచారం. ఈ సందర్భంగా షణ్ముఖన్ గారికి మరొక్కసారి ధన్యవాదాలు. అన్నట్లు regular expressions తో కూడా వెదకొచ్చు ఇందులో. అదే ఆర్చీవ్ లో ఆ సౌలభ్యం లేదు.

  2. Another tip (if it adds)

    If you’re not sure of Authors, then just type the genres like kavi (for kavi, kavita, kavitalu), kavu (for kavulu), katha (for kathalu, kathanika, kathana), navala, sahit (for sahiti, sahityam), kavy (for kavyam, kavyaalu) – you’ll end up with loads of results, but a patient dig at them tells you amazing books and authors whom you never heard of.

    DLI has one hell of old telugu magazines – QUALITY ones! If you’re digging it, look for these golds which are hard to find anywhere else. Search for patri (patrika, patrikalu) – you’ll have a big feast.

  3. డిగింగ్ మాటకేం గానీ నీ కథనం అద్భుతం. నీ తవ్వకోత్సాహానికి అభినందిస్తున్నాను.

  4. సౌమ్య,
    మీ తెలివితేటలకు నిజంగానే వందనాలు. ఆ టిప్ పైల్స్ ని ఒక్కో పేజీ దిగుమతి చేసుకోవడం దగ్గరే నేను ఆగిపోయాను. ఆ షణ్ముగమ్ గారు రాసిన టూల్ ఏమిటో నాకు తెలియదు. దీంతో పాటు నాలాంటి వాళ్ళకు ఆ సమాచారం కూడా ఇస్తే ఇంకా బాగుంటుంది.
    మాలతి గారు చెప్పినట్లు మీ తవ్వకోత్సాహానికి మరోసారి అభినందనలు.

  5. It would have been really helpful if you gave atleast a onleline intro of what DLI is and the webaddress, for ignorant people like me.

    Thanks.

  6. Thanks for an informative post. The search interface for Indian languages has a long way to go. The spellings are really pathetic. I guess the reason for variations in the spelling of a given name is due to the fact that these books got scanned at multiple places.

    They have feedback contact listed on the website. Have you considered sending them your feedback; it might help. Also, if I’m not mistaken you have some IIITH connection. Since IIITH is one of the institutions involved in this project, you might be able to use your influence to bring it to their notice and get it solved.

  7. […] by Nobody in books, india, rants, telugu, work 0 Recently I came to know about DLI through this post on Sowmya’s blog. DLI is an admirable effort to digitize old books and make them accessible […]

  8. ఈ డీ ఎల్ ఐ ఎక్కడ ఉంటుందో కొంచెం చెప్పరూ?

  9. క్షమించాలి. ఈ వ్యాఖ్య సంవత్సరం ఆలసయంగా ఇప్పుడు చూశాను. DLI URL:
    http://www.new.dli.ernet.in/

  10. పరవాలేదండి. లింకు ఇచ్చినందుకు నెనర్లు.

  11. DLI lo books download chesukovadaniki ee link use avuthundi
    https://code.google.com/p/dli-downloader/downloads/detail?name=dli-downloader-5.4-jar-with-dependencies.jar
    ee link(jar file) ni execute chesina taruvata index lo user desired language echi books down load chesukovachu .

  12. భలే రాశారండీ. సరిగ్గా ఇదే విషయాన్ని కొంత సరిజేసేందుకు వికీమీడియా ఫౌండేషన్ వాళ్ళిచ్చే గ్రాంటు సంపాయించి ఓ ఆరేడు నెలలు కష్టపడి ఆరువేల పుస్తకాలకుపైగా ఓపెన్ చేసి మెరుగైన కాటలాగులు తయారుచేశాను. దానికి సంబంధించిన ఫైనల్ రిపోర్టు ఇది. కుదిరినప్పుడు చదివిచూడండి.
    https://meta.wikimedia.org/wiki/Grants:IEG/Making_telugu_content_accessible/Final


Leave a comment