Piotr Stanek

Piotr Stanek Programista PHP /
JS developer

Temat: Szukanie błędów ortograficznych w treści

Hej,

Mam bazę 5 tys. art.. chciał bym przeskanować to w poszukiwaniu błędów czyli wynikiem np będzie lista owych treści (każda ma swoje id i trzymam ją w bazie) a obok ilość błędów. Chodzi tylko o ortograficzne.

Zna może ktoś bibliotekę jakąś.

Bo przez myśl przeszło mi napisanie czegoś co będzie współpracowało z google translator ale nie wiem czy nie dostane bana.

Ma ktoś jakiś pomysł?

konto usunięte

Temat: Szukanie błędów ortograficznych w treści

http://php.net/manual/en/ref.pspell.php
Piotr Stanek

Piotr Stanek Programista PHP /
JS developer

Temat: Szukanie błędów ortograficznych w treści

dzięki instaluję na serwerze i testuję.

Temat: Szukanie błędów ortograficznych w treści

Nasuwa mi się kilka pomysłów.

1. Ładnych parę lat temu napisałem dla sportu prosty skrypt, który sprawdzał pisownię na podstawie słownika ortograficznego PWN on-line. Jest to dość niewydajne rozwiązanie, ale można je usprawnić. Nie wiem, czy skrypt dalej działa, gdyż jest on zależny od zewnętrznego serwisu. Możesz sobie o tym poczytać tutaj: http://forum.php.pl/Korekta_ortograficzna_t77675.html

2. Możesz sobie ściągnąć Słownik Języka Polskiego np. ze strony http://www.sjp.pl/slownik/growy/ , stworzyć bazę danych i zrobić swoją korektę.

3. Kolejne i chyba najlepsze rozwiązanie, to skorzystać z Google Spell Checker API, czyli mechanizmu, który poprawia błędnie wpisane słowa w wyszukiwarce Google. Możesz zerknąć na ten artykuł wraz z przykładem: http://deepumi.wordpress.com/2010/05/20/google-spell-c...

Pozdrawiam.

Następna dyskusja:

Obsługa błędów




Wyślij zaproszenie do