https://www.duolingo.com/FieryCat

Странная магия слов

FieryCat
  • 25
  • 25
  • 14
  • 1412

Для тех, кому лень читать: тут идет речь о том, что при подсчете слов в курсе "все не так однозначно".

Пообщавшись очередной ветке форума о количестве слов в курсе а через пару дней еще в одной ветке, но более углубленно, решил выяснить как сильно отличается число слов в курсе, если использовать разные способы подсчета. Я совсем не фанат таких чисел, тем более я прекрасно понимаю, что точность подсчета тех слов "среднепотолочная" и мало отражает реальные мои знания. Будем считать, что сильно занижает :) Я не застал те времена, но раньше, говорят, количество изученных слов отображалось без всяких вывертов прямо на главной странице. Да, да, без всяких скриптов и не из вкладки "Слова", где цифра по своей точности вообще близка к пресловутому проценту беглости. Но обо всем по порядку.

Для того, чтобы повторить мой эксперимент, нужно иметь полностью завершенные деревья в тех курсах, по которым хотите получить информацию, много усидчивости, кучу бумаги, карандаш или навыки программирования. С усидчивостью у меня плохо, макулатуру я не люблю, а карандаши надо затачивать. Так получилось, что навыки программирования у меня есть и в достаточном для эксперимента объеме, а значит будет скрипт. Детали его работы не сильно важны, могу лишь сказать, что результаты работы скрипта были проверены по ключевым моментам и сверены визуально (выборочно).

Откуда я буду брать информацию? В первую очередь запрашивая сам сервер о размере нашего словарного запаса. Это как раз та цифра, что раньше отображалась и ее потом убрали. Некоторые скрипты тоже ее использовали, чтобы поддерживать старые традиции. Вторым источником будет подсчет количества слов, отображаемых в каждом уроке каждого навыка. Муторно? Да, но за меня будет считать скрипт. Третьим источником послужит та самая страничка "Слова/Words", которая отображается для некоторых курсов. Ту цифру можно увидеть в левой верхней части той странички. Тот факт, что этой странички может не быть для интересных нам курсов, своему скрипту я сообщать не буду, чтобы не вносить неуверенность в его работу.

Со списком курсов я сильно не мучился, решив проанализировать курсы для русских пользователей сайта. За базу, от которой я собираюсь считать отклонение, будет взята первая цифра, т.к. именно у нее самый минимальный дрейф в течении всей жизни курса. Итак, поехали!

Английский курс

  • Размер словарного запаса: 1397
  • Количество слов в уроках: 1945 (+39.2%)
  • Количество слов во вкладке Words: 1838 (+31.6%)
  • Количество дубликатов во вкладке: 68

Немецкий курс

  • Размер словарного запаса: 1710
  • Количество слов в уроках: 2355 (+37.7%)
  • Количество слов во вкладке Words: 2002 (+17.1%)
  • Количество дубликатов во вкладке: 29

Французский курс

  • Размер словарного запаса: 1913
  • Количество слов в уроках: 2363 (+23.5%)
  • Количество слов во вкладке Words: 2776 (+45.1) <-- Учитесь как надо накручивать.
  • Количество дубликатов во вкладке: 87

Испанский курс

  • Размер словарного запаса: 1571
  • Количество слов в уроках: 2141 (+36.3%)
  • Количество слов во вкладке Words: 2697 (+71.7%) <-- А вот это совсем не скромно!
  • Количество дубликатов во вкладке: 56

Немного о дубликатах: там вообще все странно. Часть из них отображается, часть нет, но считаются все. Их наличие легко проверить отсортировав список по первой колонке, кликнув на соответствующем заголовке. Я проверял на русском курсе, и те, что я проверял, имели форму с несколькими значениями, как, например, "девочки". Значение множественного числа в именительном падеже и значение единственного числа в родительном падеже. Но что интересно, дубликаты обычно имеют сильно разную степень закрепленности. Не от сюда ли растут ноги проблемы с невозможностью закрепить навык?

Я бы даже близко не доверял таким числам. Все цифры плавают в разных направлениях относительно базовой, количество слов в уроках в одних курсах меньше, а в других больше чем на вкладке "Слова". Алгоритм подсчета первой цифры вообще не ясен, хотя, по моему мнению, более точен. Подсчет слов в уроках чуть более очевиден, но, на сколько мне известно, тот список слов формируется динамически, по мере наполнения курса предложениями. Словоформы там меняются, дубли, если есть, не учитываются. А значение из вкладки "Слова" даже комментировать не хочется. Туда попадают разные формы слова да и еще дубликаты имеются. Мало того, в зависимости от аккаунта эта цифра может отличаться при полностью завершенных деревьях. А раньше эта цифра совпадала с общим количеством слов из уроков дерева, как минимум так было в испанском курсе. Такое ощущение, что эта вкладка живет своей жизнью, отдельно от курса.

В каких-то своих выводах я могу ошибаться, ведь информации - кот наплакал. Наверно поэтому я старался выводами не разбрасываться :) Буду рад уточнениям со стороны создателей курсов.

Напоследок: Не забывайте, что изучая конкретные слова на этом ресурсе вы заодно, возможно сами того не понимая, пополняете свой словарный запас другими словами разбираясь в конструкциях, читая примеры и комментарии других пользователей. Тем более, если параллельно занимаетесь на других ресурсах. Так что не гонитесь за этой цифрой, наверняка ваш реальный словарный запас больше указанного здесь.

Успехов!

{@fc=_t_fierycat, _t_words}

1 год назад

8 комментариев


https://www.duolingo.com/alvitin

Спасибо за проведённую работу :) Говорят, что английский - весьма лаконичный язык, поэтому сравнивать количество слов в английском курсе и русском, на мой взгляд, некорректно. К тому же, как мы знаем, все курсы Дуо используют единый каркас. Так что объём полученных знаний примерно одинаков. Дуо даёт хорошую базу, дальнейшее изучение языка зависит от нашего желания.

1 год назад

https://www.duolingo.com/FieryCat
FieryCat
  • 25
  • 25
  • 14
  • 1412

Полностью с вами согласен, именно потому я не стал сравнивать эти цифры, только опубликовал их. Вот теперь думаю что я зря их опубликовал. Не смотря на высказанный мною к ним скепсис, люди все равно ищут в них какой-то смысл. Спасибо за отзыв.

1 год назад

https://www.duolingo.com/Maria288529

спасибо

1 год назад

https://www.duolingo.com/aleweve

Да. Спасибо. Так можно понять, что мы теперь знаем где-то около двух тысяч слов. Скорее, - полторы. Ну что же. Говорят всякое знание относительно. Только незнание абсолютно. Есть куда двигаться дальше, за что Duo огромный респект и уважуха. А зачем нужен столь строгий подсчет? Все же это некая условность. Как, например, сосчитать те слова, которые человек знает в своем родном языке? Знание слов проходит в другой плоскости и не соответствует цифрам, которые можно выискать на этом сайте. У каждого человека бывает активная и пассивная лексика; и те слова, которые он использует в повседневной жизни, - и есть то, что он "знает". Все остальное, что он понимает, но не использует, он то же как-бы "знает", догадываясь о значении этих понятий в языке, но объяснить не может. Иностранный язык в этом смысле не отличается от родного. Разве нет?

1 год назад

https://www.duolingo.com/ivergruz777

Ну что же, эта выборка показывает, что в английском курсе для русских самый скудный словарный запас.

В то же время в курсе русского для знающих английский на сегодняшний день у меня пройдено 3763 слова. Позавчера было 3761, вчера 3762. Сегодня прибавилось слово Shattered. И раньше я его не встречал, хотя прошел весь курс и теперь только повторяю, отмечая пройденные слова. Когда повторял английский для русских, цифра как застыла на 1824, так дальше и не двигалась. Как вставить сюда скриншот не знаю. Поэтому просто скопировал эти строчки.

Russian words learned

3763 Words

Word Part of speech Last practiced Strength

1 год назад

https://www.duolingo.com/FieryCat
FieryCat
  • 25
  • 25
  • 14
  • 1412

Я недавно на английском форуме в одной теме публиковал объемы слов разных курсов для тех, кто знает английский. Поверьте, русский там далеко не в первых рядах. У меня на этом аккаунте в русском курсе: 3610, на другом, служебном: 3483. А если посчитать по урокам всего курса, то слов там: 2279. Я к этой цифре отношусь примерно так же, как к уровню беглости.

Мой посыл был не в том, "какой хороший/плохой курс", а в том, чтобы не сильно заморачивались на эти цифры, они мало что значат. Мой реальный словарный запас три с половиной тысячи слов? В русском языке? Да что вы говорите! ;)

1 год назад

https://www.duolingo.com/alvitin

Вопрос не по теме: ленту новостей отключили? У меня только Главная и Форум. А как же междусобойчики у кого-нибудь на странице?

Дуров, верни стену (с)

1 год назад

https://www.duolingo.com/FieryCat
FieryCat
  • 25
  • 25
  • 14
  • 1412

Ленту уже давно отключили. Уже около полугода. Вот пост по этому поводу: https://www.duolingo.com/comment/22230622. Пост на русском, но там есть ссылка на оригинал.

1 год назад
Изучайте язык всего по 5 минут день. Абсолютно бесплатно.