wordsfromtext.com - идеальный вариант для этого. Он, по сути, и станет вашим словарным запасом. Плюс, через него можно прогонять субтитры и книги - он автоматически выберет неизвестные вам слова и рассортирует их по частоте употребления в тексте. Когда-то, я потратил кучу времени, чтобы найти сервис именно с таким функционалом. В итоге - нашел)