2011. május 14., szombat

Az Orosz Nyelv Nemzeti Korpusza

Mielőtt belevágnék a világ egyhatodán beszélt nyelvet feldolgozó korpusz ismertetésébe, talán érdemes átgondolni, mi az a korpusz. Sok szöveg összegyűjtve magában még nem az, bár rengetegféle vizsgálatot így is lehet rajtuk végezni. Korpusszá az teszi őket, hogy a szövegek beválogatásának vannak valamiféle kritériumai, illetve a szövegek maguk is el vannak látva őket jellemző adatokkal. (ez a posztom a Számítógépes Nyelvészet Blogon jelent meg)

A beválogatás elvei sokfélék lehetnek; a legkézenfekvőbb az időbeli felosztás; lehet egy korpusz csak a "jelen" nyelvállapotot tükröző, ám ha különböző korú szövegeket válogatunk össze, akkor vizsgálhatjuk a nyelv diakrón változásait is. A másik kézenfekvő szempont a szöveg "műfaja": szépirodalmi, szakirodalmi, publicisztikai, és "egyéb" fajta szövegekkel lehet biztosítani, hogy az adatok kellőképpen reprezentatívak legyenek, és szokás bevenni nem írott (vagyis szóbeli) anyagot is (ez persze elég problémás, egyrészt mert elég nehéz kellő mennyiségű leírt beszélgetést beszerezni, másrészt pedig komoly kérdés az is, mi az elsődleges: az írott vagy a beszélt nyelv?), illetve meg lehet jeleníteni a nyelv különféle dialektikus változatait is. A lényeg tehát az, hogy szemben egy elektronikus könyvtárral vagy akár az egész internettel, a korpusz tartalma elvileg kiegyensúlyozott és reprezentatív. Elvileg, mert az arányokat a készítők határozzák meg, így ezek korpuszonként különbözőek.

Az Orosz Nemzeti Korpusz a fentiek közül mindegyik típusú szöveget tartalmaz (ezek külön al-korpuszokat képeznek), időben pedig a XVIII. század végétől a XXI. század elejéig terjed. Közel 50.000 dokumentumot és kb. 180 millió szót tartalmaz (ez nagyságrendileg ugyanannyi, mint a Magyar Nemzeti Szövegtár, a British National Corpus vagy a Cseh Nemzeti Korpusz egyes, önálló részei)

Minden dokumentum rendelkezik egy ID-vel, melyben többek közt szerepel létrejöttének dátuma, műfaja, szerzője, szerzőjének neme, forrása, az olvasóközönség típusa. A korpusz összes szava morfológiailag elemezve van, így nem csak konkrét szóalakra, de tövekre is kereshetünk (ismeretes, hogy az orosz alapvetően flektáló nyelv, kiterjedt ige-, főnév- és melléknév ragozással). A kereső, miután rákerestünk egy alakra, visszaadja az összes előfordulást kontextussal és forrással együtt, a szavakra kattintva pedig további nyelvtani információt kapunk. Itt érdemes megemlíteni a szintén kereshető szemantikai információkat is -- egy előre kidolgozott rendszer alapján minden szóhoz szemantikai adatok is tartoznak (pl. az "év" szóhoz: "r:abstr, t:time:age, t:time:period")

A kereső ezen túl arra is képes, hogy egy bizonyos tőnek csak bizonyos nyelvtani alakjait keresi ki (például, egy ige múlt idejű, befejezett alakjait vagy egy főnév többes szám részes eseteit). Lehetséges az üres keresés is, elvileg rá tudunk keresni az korpusz összes igéjére is. Ennek mondjuk túl sok értelme nincs, annak azonban már igen, hogy a ritka alakokra keressünk rá. Például, az oroszban nyelvben létezik egy nagyon ritka ún. "második genitivus" eset, és most végre bárki megnézheti, milyen szavakkal és mikor fordul elő. Vagy: listázni lehet az összes előforduló indulatszót.

A kereső szókombinációkat is tud keresni (az összes fenti lehetőséget kihasználva mind a két szóra), és nem is csak egymás mellet, hanem egymástól tetszőleges távolságra. És ugyanezt 3,4,5... szavas kombinációkra is. Az eredmények rendezhetők, átalakíthatók egymás alá rendezett KWIC (key word in kontext) formátumba, letölthetők excelben, XMLben...

Nagyon okos tehát az Orosz Nemzeti Korpusz, de mire lehet használni? A nyelvészek vizsgálhatják a nyelv kicsi vagy éppen óriási változásait, esetleg eddig nem észrevett sajátosságait. A nyelvtanárok eldönthetik, mennyire fontos egy szó, segíthet élővé tenni a tananyagokat. A tanuló: megtudhatja, "hogyan használják az oroszok" a szavakat. Segíthet eldönteni rengeteg "így nem is lehet mondani" vitát. Megmutathat sok különbséget különböző műfajok, az írott és a beszélt nyelv között...

(Az Orosz Nyelv Nemzeti Korpusza természetesen angol nyelven is elérhető.)

2011. január 7., péntek

Orosz metró romantika

Órákig el tudom nézegetni a moszkvai és más orosz városok metróiról készült képeket -- gyönyörű állomások, vonatos romantika, hihetetlen tömegek... más is van így ezzel, úgyhogy az interneten igazán nincs hiány anyagból a témáról. A
hírhedt englishrussia.com blogról linkelek néhány szép képet, a többihez jó szórakozást:)

2011. január 6., csütörtök

Orosz zene, szép moszkvai tájakkal

Jevgenyij Griskovec igen népszerű színész-rendező-énekes. Bár, az utolsó nem biztos, mivel nem énekel, csak elmondja a szöveget. Mindenesetre van egy-két jó dala (a youtube-on megtalálhatók), az itt következőnek a fő erőssége a szép moszkvai képekkel dúsított videóklipp.

2010. december 26., vasárnap

Hanganyag, zene, szótanulás

Újabb szórakoztató orosz hanganyag, kétnyelvű szöveggel és némi lexikai kommentárral. A jól ismert, fülbemászó dallam és mókás videóklipp igazi élménnyé teszi a tanulást;))

Токио - Мы будем вместе

(0.28)
Так устроен мир, всё меняется              Ilyen a világ, minden változik
Только чувствуй мир, будь со мной        Csak érezd a világot, legyél velem
(0.37)
Каждый новый день                              Minden új nap
Начинается наслаждением                    Élvezettel kezdődik

(0.44)
И любовь, нам не надо ждать                  És a szerelem, nem kell várnunk
Что изменится, всё само-собой              azt ami megváltozik magától
(0.54)
В этот раз. Нужно Выше быть              ez alkalommal. Magasabban kell lenni
И довериться, - это сблизит нас            és (mindent) bevallani - ez közelebb hoz

(1.03)
Припев:

Мы будем вместе, всегда                    Együtt leszünk, mindig
Оу, е! Скажи только: "Да"                  ó je! csak mondd "igen"
Мы будем вместе, всегда
Оу, е! Скажи только: "Да"

Мы будем вместе, всегда
Оу, е! Скажи только: "Да"
Мы будем вместе, всегда
Оу, е!

(1.24)
Представляй себе: "Всё сбывается"           Képzeld el: minden valóra válik
Если ты идёшь за мечтой                              ha követed az álmodat
(1.33)
Что-то новое, начинается                            ha valami új kezdődik
Ты почувствуешь, - я с тобой                          érezni fogod -- veled vagyok
Ты же знаешь, что я искал тебя                 tudod jól, hogy kerestelek
(1.48)
И заглядывал в облака                                   és a fellőkbe tekintgettem.
Это может быть, если веришь ты                  Ez lehetséges, ha hiszel (benne)
Всё у нас в руках                                   minden a kezünkben van.

(2.00)
Припев
.
.
.

Так устроен
Ilyen, így van felépítve. Az устроить jelentése tehát: felépíteni, összerakni, de lehet rendberakni, megszervezni, és beszervezni is:

Устроить из досок домик для детей.
Устроить ребенка в детский сад.

Только чувствуй мир, будь со мной
Gyönyörű példa a létige jövő idejű felszólító módjára.

Каждый новый день -- minden új nap
Itt arra érdemes felfigyelni, hogy a magyar "minden nap" szó szerint fordításban "весь день" is lehetne, ami viszont "egész nap"-ot jelentene.

наслаждение -- élvezet, mindenféle értelemben.

Есть с наслаждением.
Какое наслаждение слушать хорошую оперу!

Ellentétei: СТРАДАНИЕ - szenvedés, МУЧЕНИЕ - kín, БОЛЬ - fájdalom

В этот раз
Ez alkalommal, vagyis: most.

Ты же знаешь
Mit csinál itt a "же"? Kiemel: tudod jól.

2010. november 19., péntek

Uram, hölgyem, elvtárs -- megszólítás oroszul

Egy darabig úgy tűnt nekem, hogy az orosz nyelvkönyvek elsunnyogják a megszólítás témáját. Azon túl, hogy a név-apai név páros az udvarias, mást nem igen mondanak. Pedig igazán nem volna nehéz azt megtanítani, akár már a második leckében, hogyan kell ismeretlenekhez fordulni. Valami ilyesmit: Kérem, uram! Elnézést, Hölgyem!

A sokak által ismert Kljucs 1 kísérletet is tesz erre, ám a dolog megreked ennyinél: hivatalos esetekben a господин/господа (hölgyem/uram) megszólítást használjuk, szigorúan csak családnévvel, esetleg foglalkozásnévvel, ha az történetesen nagy presztízsű. Jó, és az utcán, ha meg akarjuk kérdezni az időt? Ott ez nem megy. Nem mondjuk. De mit mondunk?

Maguk az oroszok sem igazán tudják. A szovjetek előtt természetesen jól kidolgozott, társadalmi helyzetet figyelembe vevő megszólításrendszer állt rendelkezésre, csak üssük fel Dosztojevszkijt, meglátjuk. Azután jött az univerzális товарищ (elvtárs) megszólítás, ami a rendszerváltás után szintén kissé kínossá vált.

Más azonban nem lett helyette. A korábbi сударь, судариня (uram, hölgyem) egyszerűen nem jó minden helyzetben, túl "kifinomult", a барин (báró) meg röhögésre ingerel. A товарищ viszont paradox módon időnként még mindig használható. Szóval ezek nem igazán jók.

Ami működik, az a дебушка, молодой человек páros (kisasszony, fiatalember), így nem csak a pincért lehet magunkhoz inteni, de a járókelők figyelme is felkelthető, akár. Azonban az egy kicsit mégis komikus, amikor a nyugdíjkorhatárhoz közeledő pénztárosnénit kisasszonynak tituláljuk. De hát akkor legyen бабуля (nagyi) ?! Modhatjuk még egyszerűen azt, hogy мужчина, женщина (férfi, nő), de lássuk be, ez sem túl tiszteletteljes. Ami ezen túl van, a мужик (pasi), a брат (testvér) és számos, szlengbe nyúló változat (női változatokat nem is adunk meg inkább) -- azt a legjobb nagy ívben elkerülni.

A legjobb megoldás talán még mindig egy извините! (elnézést) vagy egy а вы не подскажите... (nem mondaná meg?) fordulattal elintézni, és kibújni az uram/hölgyem alól. Jobbat nem nagyon tehetünk.

2010. október 11., hétfő

(szórakoztató) Orosz hanganyag

Íme, egy rövid, ám eklektikus kis válogatás a YouTube-on fellelhető orosz zenéből. Érdekessé az teszi a dolgot, hogy feliratozva vannak, így akár új szavak tanulását és a hallás utáni szövegértést is segíthetik.

Д.Д.Т - МЕТЕЛЬ

Земфира - Кукушка

ПОДМОСКОВНЫЕ ВЕЧЕРА

Пусть бегут неуклюже

Д.Д.Т - Осенняя

ОЧИ ЧЁРНЫЕ

2010. október 5., kedd

Beszélgetés a normatív orosz nyelvről

A legostobább reklámszöveg, amivel a külföldieket az orosz nyelv tanulására akarják buzdítani, ha azt mondják nekik: „Tanuljanak oroszul, hogy eredetiben tudják olvasni Puskint!” Nem ez a nyelvtanulás célja. Minden nyelv alkalmazkodik. Ismétlem, a nyelv biztosítja az ’itt és most’ kommunikációt. Ez a legfőbb feladata. Éppen ezért minden nyelv állandó változásban van a körülmények függvényében. Csak a holtnyelvek nem változnak.

Beszélgetés a normatív orosz nyelv(ek)ről Jurij Prohorov nyelvésszel (az oroszvilag.hu interjúja)