AntConc and others

Для составления упражнений авторы блога используют примеры из аутентичных словарей. Лично для меня нет ничего надёжнее данного источника.

Однако существуют огромные текстовые базы с примерами употребления слов, отобранные по частотности, распространяемые по различного рода лицензиям, большинство из которых — creative commons, то есть свободное использование в некоммерческих целях. Некоторые источники допускают также коммерческое использование.

Одному из авторов блога пришла идея использовать эти огромные, миллионные текстовые базы в качестве материала для составления упражнений. Должна признаться, что одним из подобных источников, а именно British National Corpus (BNC), я пользуюсь достаточно давно. В последнее время, работая над Destination B1, мне редко приходилось обращаться к этому источнику по причине простоты лексики и достаточного количества примеров в словарях.

Но мысль соавтора меня заинтересовала, так как на подходе Destination B2, тематический словарь в которой даётся по принципу in contrast. Большие текстовые базы с примерами, как мне кажется, очень даже могут пригодиться. Однако работать с большими объёмами материала онлайн мне не хочется, тем более, что я ещё слабо ориентируюсь в наилучшем источнике для подобного рода деятельности.

Следовательно, вместо словарной оболочки нужно отыскать оболочку для корпусов. Такие оболочки (программы) существуют, одна из них AntConc. Программа кроссплатформенная, работает в Windows, Mac и Linux. Разработчик программы  — пользователь Linux Mint, у меня же установлен и Mint, и Debian. Установку произведём в Debian.

Программа — исполняемый файл. Скачиваем архив, извлекаем, щёлкаем — получаем программную оболочку.

ant_corc

Теперь нужно воспользоваться поиском и найти подходящий корпус в текстовом формате. Автор программы рекомендует brown .txt (смотрите авторские пояснения на Youtube), попробуем начать с него. Отыскали, скачали, установили в программу.

antcorc1

Осталось отсортировать примеры, выбрать нужные. Легко? Не думаю, самое сложное впереди, но так далеко в своих изысканиях я пока не заходила. Собственно создание упражнений отложено в долгий (или не очень?) ящик. Примеры употребления лексики в корпусах намного сложнее и вырвать предложение из контекста не такое простое дело. Процесс займёт намного больше времени по сравнению со словарями. Не факт, что я этим займусь. Однако информирую своих читателей о существовании альтернативы словарям при составлении собственных упражнений без нарушения чьих бы то ни было авторских прав.

Cловари, конечно, привычнее, но тот, кто стоит на месте, не движется вперёд. Следующий шагом должен стать анализ имеющихся в сети свободно распространяемых текстовых баз.

http://www.antlab.sci.waseda.ac.jp/antconc_index.html  — скачать AntConc можно по этой ссылке. Напоминаю, это не единственная программа для работы с текстами.

Один комментарий

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

шестьдесят восемь + = 78