реферат бесплатно, курсовые работы
 

Электронные словари и их применимость для традиционного машинного перевода

Как правило, толковые словари дают также грамматическую характеристику

слова, указывая с помощью специальных помет на часть речи, грамматический

род имени существительного, вид глагола и т. д. и приводя в нужных случаях

кроме «представительной», или «словарной», и некоторые другие

грамматические формы данного слова. В той или иной мере указывается и

произношение слова (например, в русских толковых словарях — ударение),

иногда сообщаются и разные другие, добавочные сведения.

Обычно толковые словари являются словарями современного литературного

языка. Некоторые из них носят строго нормативный характер, т. е. отбирают

только факты, полностью соответствующие литературной норме, рекомендуют эти

факты как единственно «правильные» и отсекают все, что хотя бы немного

отклоняется в сторону просторечья. Типичным примером может служить

академический словарь французского языка (Dictionnaire de I'Academie

Franзaise). Для многих других толковых словарей характерно более широкое

понимание литературного языка и, соответственно, включение в словарь

разговорной и даже просторечной лексики (кроме лишь узко-областных,

диалектных, узкопрофессиональных и сугубо арготических элементов). К этому

типу относятся академические словари русского языка — 17-томный «Словарь

современного русского литературного языка» Академии наук СССР (1950—1965) и

4-томный «Словарь русского языка» (1957—1961), а также однотомный «Словарь

русского языка» С. И. Ожегова (9-е испр. и доп. издание под ред. Н. Ю.

Шведовой 1972 г.), который очень полезен для практических целей, и более

ранний «Толковый словарь русского языка» коллектива авторов под ред. Д. Н.

Ушакова (4 тома, 1935—1940). Особое значение для русской лексикографии

имеет, конечно, 17-томный академический «Словарь современного русского

литературного языка». Он включает более 120 тыс. слов. В 1970 г. он отмечен

Ленинской премией.

Иной характер носит знаменитый, не раз переиздававшийся «Толковый

словарь живого великорусского языка» В. И. Даля (4 тома, первое изд.

1863—1866 гг.), в изобилии включающий областную и диалектную лексику

середины 19 века и в отношении полноты охвата этой лексики и обилия

народных выражений до сих пор непревзойденный. Он включает около 200 тыс.

слов литературного языка и диалектов. С 1965 г. начал выходить «Словарь

русских народных говоров» под редакцией Ф. П. Филина, в котором

представлены диалектная лексика и фразеология всех русских говоров 19-20

веков.

Главная задача толкового словаря – истолковать значение слов и их

применение в речи, отграничить правильное от неправильного, показать связь

слов со стилями языка, дать читателю сведения об особенностях падежных,

родовых, залоговых, видовых и иных грамматических форм слова; попутно

указывается, как слова пишутся и произносятся.

Толковые словари, как правило (но не всегда), оказываются и

нормативными, т.е. объясняющими слова в соответствии с требованиями

литературно-языковых норм (норма применительно к языку – это выработанное

при участии литературы и принятое обществом в качестве обязательного

правило, регулирующее применение слова в речи, его написание, произношение

и ударение). Так, все перечисленные толковые словари русского языка –

нормативные, за исключением «Толкового словаря живого великорусского языка»

В.И. Даля.

Переводные словари. Толковым словарям противостоят переводные, чаще

всего двуязычные (скажем, русско-английский и англо-русский), а иногда

многоязычные. В переводных словарях вместо толкования значений на том же

языке даются переводы этих значений на другой язык, например, накалиться -

become heated, назойливый – importunate, troublesome. В зависимости от

того, предназначен ли словарь как пособие при чтении (слушании) текста на

чужом языке, или как пособие при переводе с родного языка на чужой, его

желательно строить по-разному. Так, русско-английский словарь для англичан

может давать меньше сведений в «правой» (т. е. английской) части, чем их

дает русско-английский словарь, предназначенный для русских. Например,

переводя русское обращение, словарь для англичан может просто перечислить

все возможные английские эквиваленты (address, appeal; conversion;

treatment, circulation и т. д.), так как англичанину известны смысловые

различия между этими английскими словами; в словаре же для русских придется

указать, что address и appeal это ‘обращение к ...’, причем appeal это

‘обращение’ в смысле’призыв’; что conversion это ‘обращение в веру’ и т.

п., что treatment это ‘обращение с...’, ‘обхождение с кем-либо’, a

circulation ‘обращение товаров, денег и т. п.’; кроме того, придется

указать, с какими предлогами употребляются эти английские существительные,

даже указать место ударения, т. е. снабдить английские эквиваленты многими

разъяснениями, которые помогут правильно употребить их, переводя текст со

словом обращение с родного русского языка на иностранный английский. Ясно,

что в англо-русском словаре картина соответственно изменится. В словаре,

рассчитанном на русских, русская часть будет менее подробной, но в словаре,

предназначенном для англичан, придется подробно указывать различия в

значениях и в употреблении русских эквивалентов, снабжать их

грамматическими пометами, указывать ударение и т. д. Хороший переводный

словарь должен содержать также стилистические пометы и особо отмечать

случаи, когда переводящий эквивалент является неточным в стилистическом

отношении. Перевод слов всегда представляет большую трудность, т.к. объем

значения слова в разных языках часто не совпадает, переносные значения в

каждом языке развивается по-своему. Так, в русском сон означает и «сон»

(состояние сна) и «сновидение», а в чешском первому соответствует spanek, а

второму – sen, аналогично в английском различают sleep и dream, slumber; в

немецком Schlaf и Traum. Наоборот, важное для русского языка различие

глаголов идти и ехать не получит отражения в переводе на болгарский язык,

где будет общий глагол ида, идвам, и французский, где arriver – и идти, и

ехать и т.п.

Переводные словари могут быть двуязычными (русско-французский, англо-

русский и т.п.) и многоязычными. К последним относится составленный А. и В.

Поповыми «Словарь на семи языках (французско-немецко-английско-итальянско-

испанско-португальско-голладско-русский)», вышедший в свет в 1902 г.

Теоретическое и практическое значение подобных словарей весьма невелико.

Значительно важнее многоязычные специальные словари, дающие перевод какой-

либо отраслевой терминологии на ряд языков, например, выпущенный в России в

1881 г. «Карманный русско-английско-французско-итальянско-датский и

норвежско-латышский морской словарь». В последнее время довольно широкое

распространение получили краткие многоязычные словари с подбором наиболее

употребительных слов и выражений. Примером может быть «Славянский

разговорник», выпущенный в Софии в 1961 г.. В нем приведены приветствия

(«Здравствуйте!» и т.п..), предостережения («Берегитесь!» и т.п.), слова

для беседы на бытовые темы в гостях, в магазине, на почте и т.д. на

русском, сербохорватском, болгарском, польском и чешском языках.

Многоязычные словари могут иметь различную целевую установку. Так, в 18 и

начале 19 века были распространены «каталоги языков», где к данному слову

подбирались все известные переводы на любые языки; позднее этот тип стал

более узким и практическим, объединяя переводы либо на группу родственных

языков, либо на группу языков одной географической местности в помощь

туризму и путешествиям.

К общим словарям мы отнесем также словари, рассматривающие (в принципе)

всю лексику, но под каким-либо специфическим углом зрения. Таковы, в

частности, словообразовательные (деривационные) словари, указывающие

членение слов на составляющие их элементы, т.е. дают справки о

морфологическом составе слова. Примером может служить «Школьный

словообразовательный словарь» З.А. Потихи (1964г.). Далее этимологические

словари (одного языка или группы родственных языков), содержащие сведения о

происхождении и первоначальной мотивировке слов. Краткие этимологические

словари обыкновенно ограничиваются приведением для каждого слова одной

этимологии, представляющейся автору словаря наиболее вероятной. В более

крупных и солидных словарях, как правило, приводятся соответствия в

родственных языках и излагаются «контроверзы», т. е. споры ученых,

касающиеся этимологии тех или иных слов, даются краткие сводки предложенных

гипотез и их критическая оценка. В этимологические словари принято включать

и слова, этимология которых остается неясной (в этих случаях так и

указывают: «неясно»). Производные и сложные слова, мотивировка которых

очевидна, либо вовсе не включаются в этимологический словарь, либо основные

из них перечисляются для иллюстрации словообразовательной активности

производящего слова, или в тех случаях, когда в производных отражены связи

с какими-то более старыми значениями, утраченными производящим словом.

Примером этимологических словарей могут служить «Этимологический словарь

русского языка» А. Преображенского, «Russisches etymologisches Wцrterbuch»

М. Фасмера, который с 1966 г. начал выходить в русском переводе. Для

практических целей может быть полезен вышедший в 1961 г. «Краткий

этимологический словарь русского языка» Н.М. Шанского, В.В. Иванова и Т.В.

Шанской.

От этимологических словарей следует отличать исторические словари,

которые, в свою очередь, представлены двумя разновидностями. В некоторых из

них ставится цель — проследить эволюцию каждого слова и его отдельных

значений на протяжении письменно засвидетельствованной истории

соответствующего языка, обычно вплоть до современности (или какого-то

отрезка этой истории, тоже вплоть до современности). Примерами словарей

этого типа могут служить «большой Оксфордский словарь» английского языка,

немецкие словари — начатый братьями Гримм и словарь Г. Пауля, большой

словарь Шведской академии и некоторые другие. Ко второй разновидности

исторических словарей следует отнести словари древних периодов истории

соответствующего языка, например «Материалы для словаря древнерусского

языка» (в трех томах) филолога и этнографа Изм. Ив. Срезневского, изданный

в 1893-1903гг., а дополнения к нему в 1912 г., а также словари отдельных

писателей прошлого (в том числе и недавнего прошлого) или даже отдельных

памятников.

Предшественниками исторических словарей были азбуковники, лексиконы и

так называемые притекстовые словари: они помещались прямо при текстах и в

них объяснялись слова только конкретного данного текста. Сущность

исторического словаря Л. В. Щерба в свое время охарактеризовал следующим

образом: «Историческим в полном смысле этого термина был бы такой словарь,

который давал бы историю всех слов на протяжении определенного времени,

причем указывалось бы не только возникновение новых слов и новых значений,

но и их отмирание, а также их видоизменение».

Знакомство с историческими (как и с этимологическими) словарями

позволяет выяснить историю слов и выражений современного языка, заглянуть в

их «биографию». Так, например, открыв словарь И. И. Срезневского, можно

узнать, что такие однокорневые и близкие по значению современные слова, как

работник, рабочий, рабочая (о лице), восходят к слову раб, претерпев

длительную эволюцию в своих значениях. Теперь прежняя связь со словом раб

этих и других однокорневых слов никем непосредственно не осознается,

например: работа – рабство, неволя... (т. 3, с. 2 указанного словаря);

работати, работаю – находиться в рабстве, в неволе... (т. 3, с. 4);

работъникъ – раб, невольник... (т. 3, с. 5); работъница – служанка,

раба...; работъный – относящийся к рабству...; рабъ – слуга, невольник...

(т. 3, с. 5) и т. д. Эти и другие слова с таким же корнем снабжены

примерами из древних памятников письменности.

Другая разновидность исторического словаря – это словарь писателя.

Словарь писателя или отдельного памятника должен быть исчерпывающим, т. е.

должен а) включать абсолютно все слова, употребленные в сочинениях (также в

сохранившихся письмах и т. д.) данного писателя и б) указывать все

встретившиеся формы этих слов. Обычно такой словарь не только иллюстрирует

цитатами из текста все выделенные значения и оттенки значений, но и дает

«адреса» всех случаев употребления слова (например, том, страницу, строку

для каждого случая употребления). Если подобным образом строится словарь не

одного писателя, а целого периода в истории языка, такой словарь

оказывается исчерпывающим для этого периода, или так называемым

«тезаурусом». Хорошим примером словаря писателя может служить «Словарь

языка Пушкина» (т.1-4, АН СССР, М, 1956-1961), за рубежом созданы словари

Шекспира, Гете и других больших литераторов. Такие словари нужны науке для

того, чтобы можно было полнее и правильнее понять, как развивается так

называемый язык художественной литературы, т.е. тот стиль общего

литературного языка, который обслуживает художественное творчество,

словесное искусство. Прежде всего, составляются словари по произведениям

наиболее крупных писателей и поэтов, имеющих национальное значение в

развитии культуры.

Особое место занимают диалектологические, или диалектные словари.

Диалектный словарь может быть дифференциальным, т. е. содержащим только

диалектную лексику, отличающуюся от общенародной, либо полным, охватывающим

в принципе всю лексику, бытующую в диалектной речи — как специфическую для

данного диалекта, так и совпадающую с лексикой общенародного языка. Кроме

того, он может быть либо словарем одного говора (даже говора одной

деревни), либо словарем целой группы близких говоров, рассматриваемых как

один диалект, либо, наконец, сравнительным словарем многих или даже всех

территориальных диалектов какого-либо языка. К диалектологическим (в

широком смысле) относятся словари слэнга и арго. Примерами словарей,

включающих лексику одного диалекта, могут быть некоторые старые диалектные

словари, такие, как «Материалы для объяснительного областного словаря

вятского говора» Н. Васнецова (1908 г.), «Смоленский областной словарь» В.

Добровольского (1914 г.), и новые: «Словарь современного русского народного

говора» под ред. И.А. Оссовецкого, в котором дана лексическая система

одного из говоров (дер. Деулино) Рязанской области, «Псковский областной

словарь с историческими данными», который начал выходить с 1967 г.;

«Словарь русских старожильческих говоров средней части бассейна р. Оби» и

подобные. Словари, включающие разные диалекты языка, представлены «Опытом

областного великорусского словаря» Академии наук (1852 г.), «Толковым

словарем живого великорусского языка» В. Даля, «Словарем русских народных

говоров» и подобными.

Интересный и сравнительно новый тип словарей — частотные словари. Их

задача — показать сравнительную частоту употребления слов языка в речи, что

практически значит в некотором массиве текстов. Примерами частотных

словарей являются «The Russian Word Count» (Detroit, 1953) Йоссельсона,

составленный на основе данных статистического анализа употребления около

одного миллиона слов, и «Частотный словарь современного русского

литературного языка», составленный Э. А. Штейнфельдт и изданный в Таллине в

1963 г. Словарь содержит 2500 наиболее употребительных слов, выбранных из

современных текстов (художественной литературы для детей и взрослых, пьес,

радиопередач, газет) общим объемом в 400 тысяч словоупотреблений.

Важнейшими частями словаря являются: 1) общий список слов, расположенных в

порядке убывания частоты, с указанием при каждом слове абсолютного

количества встретившихся случаев его употребления; 2) список по частям речи

с указанием (правда, не для всех частей речи) частоты отдельных

грамматических форм (например, слово год встретилось 810 раз, в т. ч. 684

раза в ед. и 126 раз во мн. числе, 111 раз в именит., 244 раза в родит, п.

и т. д.); 3) общий список слов по алфавиту с указанием частоты (для

омонимов — раздельно по частям речи; например, союз а встретился 3442 раза,

частица а — 578 раз, междометие а — 54 раза). Кроме названных выше словарей

существуют и другие. Например, "Подсчет русских слов" Х. Джоссельсона,

«Частотный словарь немецкого языка» Ф. Кэдинга, «Сравнительный частотный

список первой тысячи слов английского, французского, немецкого и испанского

языков» Х. Итона. Частотные словари позволяют делать очень интересные

выводы о функционировании в речи слов и грамматических категорий языка. Они

имеют также большое практическое значение, в частности для рационального

отбора лексики на разных этапах обучения данному языку тех, для кого он не

является родным. Таким образом, развитие математических, прежде всего

статистических методов изучения языка породило частотные словари, слова в

которых получают числовой, статистический показатель, т.е. цифровые

сведения о том, как часто применяется то или иное слово в языке.

Чисто практические цели преследуют орфографические и орфоэпические

словари, указывающие «правильное» (т. е. отвечающее принятой норме)

написание слов и их форм или, соответственно, их «правильное» произношение.

Наибольшее распространение получили орфографические словари, дающие

сведения о правильном написании слов. Орфоэпические словари указывают

правильное произношение слов. Например, словарь-справочник «Русское

литературное произношение и ударение» Р.И. Аванесова и С.И. Ожегова.

Среди специальных лингвистических словарей большой интерес представляют

различные фразеологические словари. Они бывают переводными (например, англо-

русский фразеологический словарь А. В. Кунина) и одноязычными, дающими

толкование значений фразеологизмов средствами того же самого языка. К этому

последнему типу принадлежит, в частности, «Фразеологический словарь

русского языка» под ред. А. И. Молоткова (М., 1967), включающий 4000

словарных статей, а также более старый, но не потерявший своей ценности

словарь М. И. Михельсона, широко дающий и иноязычные параллели к русским

фразеологизмам, а также справки о происхождении фразеологизмов, об их

первоначальной мотивировке и т. д.. Материалом фразеологических словарей

являются не слова, а фразеологические обороты. Такие словари есть во всех

языках. В русском наиболее распространены: «Крылатые слова» С.В. Максимова

(ряд изданий) и Н.С. и М.Г. Ашукиных (М., 1960) и ранее упоминавшийся

«Фразеологический словарь русского языка».

Разновидностью фразеологических словарей являются словари «крылатых

слов», т. е. ходовых цитат из литературных произведений, афоризмов

знаменитых людей и др. фразеологизмов, главным образом книжного

употребления, имеющих литературный источник. Обычно в словарях такого рода

большое место занимают «крылатые фразы», вошедшие в культурный обиход

многих народов, в том числе и такие, которые нередко цитируются в

Страницы: 1, 2, 3, 4, 5, 6


ИНТЕРЕСНОЕ



© 2009 Все права защищены.