1. Форум
  2. >
  3. Раздел: Duolingo
  4. >
  5. Странная магия слов

https://www.duolingo.com/profile/FieryCat

Странная магия слов

Для тех, кому лень читать: тут идет речь о том, что при подсчете слов в курсе "все не так однозначно".

Пообщавшись очередной ветке форума о количестве слов в курсе а через пару дней еще в одной ветке, но более углубленно, решил выяснить как сильно отличается число слов в курсе, если использовать разные способы подсчета. Я совсем не фанат таких чисел, тем более я прекрасно понимаю, что точность подсчета тех слов "среднепотолочная" и мало отражает реальные мои знания. Будем считать, что сильно занижает :) Я не застал те времена, но раньше, говорят, количество изученных слов отображалось без всяких вывертов прямо на главной странице. Да, да, без всяких скриптов и не из вкладки "Слова", где цифра по своей точности вообще близка к пресловутому проценту беглости. Но обо всем по порядку.

Для того, чтобы повторить мой эксперимент, нужно иметь полностью завершенные деревья в тех курсах, по которым хотите получить информацию, много усидчивости, кучу бумаги, карандаш или навыки программирования. С усидчивостью у меня плохо, макулатуру я не люблю, а карандаши надо затачивать. Так получилось, что навыки программирования у меня есть и в достаточном для эксперимента объеме, а значит будет скрипт. Детали его работы не сильно важны, могу лишь сказать, что результаты работы скрипта были проверены по ключевым моментам и сверены визуально (выборочно).

Откуда я буду брать информацию? В первую очередь запрашивая сам сервер о размере нашего словарного запаса. Это как раз та цифра, что раньше отображалась и ее потом убрали. Некоторые скрипты тоже ее использовали, чтобы поддерживать старые традиции. Вторым источником будет подсчет количества слов, отображаемых в каждом уроке каждого навыка. Муторно? Да, но за меня будет считать скрипт. Третьим источником послужит та самая страничка "Слова/Words", которая отображается для некоторых курсов. Ту цифру можно увидеть в левой верхней части той странички. Тот факт, что этой странички может не быть для интересных нам курсов, своему скрипту я сообщать не буду, чтобы не вносить неуверенность в его работу.

Со списком курсов я сильно не мучился, решив проанализировать курсы для русских пользователей сайта. За базу, от которой я собираюсь считать отклонение, будет взята первая цифра, т.к. именно у нее самый минимальный дрейф в течении всей жизни курса. Итак, поехали!

Английский курс

  • Размер словарного запаса: 1397
  • Количество слов в уроках: 1945 (+39.2%)
  • Количество слов во вкладке Words: 1838 (+31.6%)
  • Количество дубликатов во вкладке: 68

Немецкий курс

  • Размер словарного запаса: 1710
  • Количество слов в уроках: 2355 (+37.7%)
  • Количество слов во вкладке Words: 2002 (+17.1%)
  • Количество дубликатов во вкладке: 29

Французский курс

  • Размер словарного запаса: 1913
  • Количество слов в уроках: 2363 (+23.5%)
  • Количество слов во вкладке Words: 2776 (+45.1) <-- Учитесь как надо накручивать.
  • Количество дубликатов во вкладке: 87

Испанский курс

  • Размер словарного запаса: 1571
  • Количество слов в уроках: 2141 (+36.3%)
  • Количество слов во вкладке Words: 2697 (+71.7%) <-- А вот это совсем не скромно!
  • Количество дубликатов во вкладке: 56

Немного о дубликатах: там вообще все странно. Часть из них отображается, часть нет, но считаются все. Их наличие легко проверить отсортировав список по первой колонке, кликнув на соответствующем заголовке. Я проверял на русском курсе, и те, что я проверял, имели форму с несколькими значениями, как, например, "девочки". Значение множественного числа в именительном падеже и значение единственного числа в родительном падеже. Но что интересно, дубликаты обычно имеют сильно разную степень закрепленности. Не от сюда ли растут ноги проблемы с невозможностью закрепить навык?

Я бы даже близко не доверял таким числам. Все цифры плавают в разных направлениях относительно базовой, количество слов в уроках в одних курсах меньше, а в других больше чем на вкладке "Слова". Алгоритм подсчета первой цифры вообще не ясен, хотя, по моему мнению, более точен. Подсчет слов в уроках чуть более очевиден, но, на сколько мне известно, тот список слов формируется динамически, по мере наполнения курса предложениями. Словоформы там меняются, дубли, если есть, не учитываются. А значение из вкладки "Слова" даже комментировать не хочется. Туда попадают разные формы слова да и еще дубликаты имеются. Мало того, в зависимости от аккаунта эта цифра может отличаться при полностью завершенных деревьях. А раньше эта цифра совпадала с общим количеством слов из уроков дерева, как минимум так было в испанском курсе. Такое ощущение, что эта вкладка живет своей жизнью, отдельно от курса.

В каких-то своих выводах я могу ошибаться, ведь информации - кот наплакал. Наверно поэтому я старался выводами не разбрасываться :) Буду рад уточнениям со стороны создателей курсов.

Напоследок: Не забывайте, что изучая конкретные слова на этом ресурсе вы заодно, возможно сами того не понимая, пополняете свой словарный запас другими словами разбираясь в конструкциях, читая примеры и комментарии других пользователей. Тем более, если параллельно занимаетесь на других ресурсах. Так что не гонитесь за этой цифрой, наверняка ваш реальный словарный запас больше указанного здесь.

Успехов!

{@fc=_t_fierycat, _t_words}

September 14, 2017

8 комментариев

По популярности комментариев

https://www.duolingo.com/profile/alvitin

Спасибо за проведённую работу :) Говорят, что английский - весьма лаконичный язык, поэтому сравнивать количество слов в английском курсе и русском, на мой взгляд, некорректно. К тому же, как мы знаем, все курсы Дуо используют единый каркас. Так что объём полученных знаний примерно одинаков. Дуо даёт хорошую базу, дальнейшее изучение языка зависит от нашего желания.

September 17, 2017

https://www.duolingo.com/profile/FieryCat

Полностью с вами согласен, именно потому я не стал сравнивать эти цифры, только опубликовал их. Вот теперь думаю что я зря их опубликовал. Не смотря на высказанный мною к ним скепсис, люди все равно ищут в них какой-то смысл. Спасибо за отзыв.

September 17, 2017

https://www.duolingo.com/profile/Maria288529

спасибо

September 15, 2017

https://www.duolingo.com/profile/aleweve

Да. Спасибо. Так можно понять, что мы теперь знаем где-то около двух тысяч слов. Скорее, - полторы. Ну что же. Говорят всякое знание относительно. Только незнание абсолютно. Есть куда двигаться дальше, за что Duo огромный респект и уважуха. А зачем нужен столь строгий подсчет? Все же это некая условность. Как, например, сосчитать те слова, которые человек знает в своем родном языке? Знание слов проходит в другой плоскости и не соответствует цифрам, которые можно выискать на этом сайте. У каждого человека бывает активная и пассивная лексика; и те слова, которые он использует в повседневной жизни, - и есть то, что он "знает". Все остальное, что он понимает, но не использует, он то же как-бы "знает", догадываясь о значении этих понятий в языке, но объяснить не может. Иностранный язык в этом смысле не отличается от родного. Разве нет?

September 15, 2017

https://www.duolingo.com/profile/ivergruz777

Ну что же, эта выборка показывает, что в английском курсе для русских самый скудный словарный запас.

В то же время в курсе русского для знающих английский на сегодняшний день у меня пройдено 3763 слова. Позавчера было 3761, вчера 3762. Сегодня прибавилось слово Shattered. И раньше я его не встречал, хотя прошел весь курс и теперь только повторяю, отмечая пройденные слова. Когда повторял английский для русских, цифра как застыла на 1824, так дальше и не двигалась. Как вставить сюда скриншот не знаю. Поэтому просто скопировал эти строчки.

Russian words learned

3763 Words

Word Part of speech Last practiced Strength

September 16, 2017

https://www.duolingo.com/profile/FieryCat

Я недавно на английском форуме в одной теме публиковал объемы слов разных курсов для тех, кто знает английский. Поверьте, русский там далеко не в первых рядах. У меня на этом аккаунте в русском курсе: 3610, на другом, служебном: 3483. А если посчитать по урокам всего курса, то слов там: 2279. Я к этой цифре отношусь примерно так же, как к уровню беглости.

Мой посыл был не в том, "какой хороший/плохой курс", а в том, чтобы не сильно заморачивались на эти цифры, они мало что значат. Мой реальный словарный запас три с половиной тысячи слов? В русском языке? Да что вы говорите! ;)

September 16, 2017

https://www.duolingo.com/profile/alvitin

Вопрос не по теме: ленту новостей отключили? У меня только Главная и Форум. А как же междусобойчики у кого-нибудь на странице?

Дуров, верни стену (с)

September 17, 2017

https://www.duolingo.com/profile/FieryCat

Ленту уже давно отключили. Уже около полугода. Вот пост по этому поводу: https://www.duolingo.com/comment/22230622. Пост на русском, но там есть ссылка на оригинал.

September 17, 2017
Изучайте язык всего по 5 минут день. Абсолютно бесплатно.