V knige opisany instrumenty i metody obrabotki nestrukturirovannyh tekstov. Prochitav ee, vy nauchites polzovatsya polnotekstovym poiskom, raspoznavat imena sobstvennye, proizvodit klasterizatsiyu, pometku, izvlechenie informatsii i avtoreferirovanie. Znakomstvo s fundamentalnymi printsipami soprovozhdaetsya izucheniem realnyh primeneniy.
Izdanie prednaznacheno dlya chitateley bez podgotovki v oblasti matematicheskoy statistiki i obrabotki estestvennyh yazykov. Primery napisany na Java, no sami idei mogut byt realizovany na lyubom yazyke programmirovaniya.