Eta kniga napisana veduschimi spetsialistami v oblasti tehnologiy baz dannyh i veba. Blagodarya populyarnosti internet-torgovli poyavilos mnogo chrezvychayno obemnyh baz dannyh, dlya izvlecheniya informatsii iz kotoryh nuzhno primenyat metody dobychi dannyh (data mining).
V knige opisyvayutsya algoritmy, kotorye realno ispolzovalis dlya resheniya vazhneyshih zadach dobychi dannyh i mogut byt s uspehom primeneny dazhe k ochen bolshim naboram dannyh. Izlozhenie nachinaetsya s rassmotreniya tehnologii MapReduce - vazhnogo sredstva rasparallelivaniya algoritmov. Izlagayutsya algoritmy heshirovaniya s uchetom blizosti i potokovoy obrabotki dannyh, kotorye postupayut slishkom bystro dlya tschatelnogo analiza. V posleduyuschih glavah rassmatrivaetsya ideya pokazatelya PageRank, nahozhdenie chastyh predmetnyh naborov i klasterizatsiya. Vo vtoroe izdanie vklyuchen dopolnitelnyy material o sotsialnyh setyah, mashinnom obuchenii i ponizhenii razmernosti.
Izdanie budet v ravnoy mere polezna studentam i programmistam-praktikam.