Wondering what’s next for npm?Check out our public roadmap! »

@h9h/word-collect

1.0.7 • Public • Published

word-collect

Simple Library to collect word-sets, optionally using stemming algorithms

MIT license npm version Codacy Badge XO code style

Usage

const { collectWords } = require('../src/collector')

const text = '...'

const result = collectWords('de', text)
console.log(result.getWordDistribution(3))

Example

Mephistopheles:

Ein Teil von jener Kraft, Die stets das Böse will und stets das Gute schafft.

Faust:

Was ist mit diesem Rätselwort gemeint?

Mephistopheles:

Ich bin der Geist, der stets verneint! Und das mit Recht; denn alles, was entsteht, Ist wert, daß es zugrunde geht; Drum besser wär's, daß nichts entstünde. So ist denn alles, was ihr Sünde, Zerstörung, kurz, das Böse nennt, Mein eigentliches Element.

Faust:

Du nennst dich einen Teil, und stehst doch ganz vor mir?

Result:

Array(1)
    Array(2)
        0 = "stets"  // Word
        1 = 3        // Count

@h9h/word-collect

word-collect module

Given a text, this modules offers methods to

  • break the text into words
  • removes stop-words (aka noise)
  • stemm those words (reduzing them to their base form)
  • and counting the occurrences of these stemms

The result is a distribution of the main words in this text, giving a quick overview what it's all about.

Keywords

Install

npm i @h9h/word-collect

DownloadsWeekly Downloads

0

Version

1.0.7

License

MIT

Unpacked Size

48.7 kB

Total Files

8

Last publish

Collaborators

  • avatar