Teraz jest 2019-10-21, 12:16

Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]




Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 20 ]  Przejdź na stronę 1, 2  Następna strona
Autor Wiadomość
PostNapisane: 2005-12-29, 13:40 
Offline

Dołączył(a): 2005-12-29, 13:30
Posty: 11
Czy istnieje wersja DICT, ktora pozwala wykorzystac go w innych programach, tzn. czy jest on dystrybuowany np. w postaci jara wraz z odpowiednim API pozwalajacym na wykonywanie zapytan o poszczegolne slowa (chodzi mi o wersje pol-eng-pol).

Jesli nie, to czy istnieja plany stworzenia takiej wersji tego slownika oraz czy moze ktos zna slownik udostepniajacy taka funkcjonalnosc.


Góra
 Zobacz profil  
 
PostNapisane: 2005-12-29, 21:30 
Offline
Avatar użytkownika

Dołączył(a): 2004-03-22, 22:38
Posty: 1837
Lokalizacja: Zielona Góra
apohllo napisał(a):
Czy istnieje wersja DICT, ktora pozwala wykorzystac go w innych programach, tzn. czy jest on dystrybuowany np. w postaci jara wraz z odpowiednim API pozwalajacym na wykonywanie zapytan o poszczegolne slowa (chodzi mi o wersje pol-eng-pol).

Chyba nie do końca zrozumiałem Twoje pytanie... Chciałbyś mieć cały engine słownika i bazę danych w formie jara? Nie sądzę aby było to wykonalne...

A tak właściwie to co chcesz zrobić, że potrzebne jest Ci API?

Cytuj:
Jesli nie, to czy istnieja plany stworzenia takiej wersji tego slownika oraz czy moze ktos zna slownik udostepniajacy taka funkcjonalnosc.

Tego nie wiem, ale raczej nie liczyłbym na to - jest wersja on-line (także dla PDA) i midlet dla telefonów obsługujących Jave. Ktoś też napisał aplikację, która zastępuje przeglądarkę - gdzieś w tym dziale jest wątek na ten temat...

Pozdr,
GZ

_________________
"I love deadlines. I love the whooshing noise they make as they go by." [Douglas Adams]


Góra
 Zobacz profil  
 
 Tytuł:
PostNapisane: 2006-01-04, 14:37 
Offline
Avatar użytkownika

Dołączył(a): 2005-01-13, 10:41
Posty: 4332
Lokalizacja: Poznań
i think ze ta osoba chcialaby stworzyc program w ktorym bylby engine i baza edicta.

_________________
Tłumacz języka angielskiego
Katalog polskojęzycznych stron o tłumaczeniach


Góra
 Zobacz profil  
 
PostNapisane: 2006-01-08, 03:07 
Offline

Dołączył(a): 2005-12-29, 13:30
Posty: 11
To tajny projekt finansowany z pięniedzy CIA ;)

Cytuj:
Chciałbyś mieć cały engine słownika i bazę danych w formie jara? Nie sądzę aby było to wykonalne...


A dlaczegóż miałoby to być niewykonalne??? Jar to zwykłe archiwum, o tyle niezwykłe, że eksportuje pewne symbole, jak każda porządna biblioteka programistyczna. Wystarczy zorientować się jak jest dystrybuowanych większość programóm napisanych pod Java - log4j, jUnit, ant, weka, zeby wymienic te, z ktorych korzystam najczesciej. Problem by sie pojawil, gdyby DICT korzystal z jakiej zewnwtrznej bazy danych w stylu mySQL. Obserwując jednak, że jest on dostępny na PDA inferuje, że raczej nie posiadają one wbudowanego DBMS. Dobrze koniec tego mądrzenia się.

Dlaczego jest mi potrzebny słownik i engine słownika - no bo nie chce mi sie grzebac w słowniku, który jest w jakiejś surowej postaci. Wydaje się, że autorzy zmontowali sprytne mechanizmy wyszukiwania, z których chciałbym skorzystać. Ponadto nie chcę dostawać danych tekstowych, tzn. Stringow, tylko jakąś strukturę danych, gdzie miałbym wyróżnione poszczególne znaczenia, z jakimś sensownym opisem semantycznym, tzn. jeśli mamy słowo wieloznaczne, to te znaczenia są ładnie wyodrębnione i dodatkowo ładnie opisane, przy czym ładnie znaczy w postaci słów kluczowych ;)

Mówiąc krótko - chciałbym mieć coś na kształt WordNetu, tylko, zawierającego mapowania w 2 językach...

A po co mi taki słownik? Dobre pytanie - chciałbym stowrzyć polski leksykon dla CYC i nie chciałbym tego robić ręcznie, bo wątpię, żeby starczyło mi życia. Zatem konstruując pewne algorytmy oraz rzeczony słownik, chciałbym właśnie stworzyć ów polski leksykon.
No dobrze - ale po co mi polski leksykon w CYC, pyta dociekliwy interlokutor? Otóż CYC jest niezwykle bogatą bazą wiedzy, która może przydać się w wielu trudnych problemach NLP, zatem przydałoby się mieć coś na kształt jego polskiej wersji.

Czy moja argumentacja jest wyczerpująca i przekonująca?
:D

Acha - sprostowanie, jest jakieś middleware dla komórek - które najwyraźniej łączy się z webservicem, który jest na ich stronie. Hm... zatem pewnie to stoi na jakiejś bazie danych (swoją drogą słuszne rozwiązanie). No to wtedy jar mógłby nie wystarczyć ale, to nie ma w zasadzie większego znaczenia... (no chyba, że w tym jarze byłby instalator, który by wypluwał innego jara i tworzył bazę danych przenosząc do niej dane ze słownika - z resztą - nie ważne)

A dlaczego webservice mnie nie zadowala. Hm, niech pomyślę, tłumaczenie 200000 słów mogłoby trochę zając, gdyby dla każdego trzeba by było zestawić połączenie http, etc. etc.

W każdym razie - dziękuję za uwagi i pozdrawiam.
Gdybyście słyszeli o tym o czym piszę, to proszę - dajcie znać.


Góra
 Zobacz profil  
 
PostNapisane: 2006-01-08, 13:47 
Offline
Avatar użytkownika

Dołączył(a): 2004-03-22, 22:38
Posty: 1837
Lokalizacja: Zielona Góra
apohllo napisał(a):
To tajny projekt finansowany z pięniedzy CIA ;)

W takim razie skontaktuj się z kimś z NSA, oni z pewnością mają mnóstwo najróżniejszych gotowych rozwiązań... ;)

apohllo napisał(a):
A dlaczegóż miałoby to być niewykonalne??? [...] Problem by sie pojawil, gdyby DICT korzystal z jakiej zewnwtrznej bazy danych w stylu mySQL.

No to właśnie pojawił Ci się problem... :)

apohllo napisał(a):
Obserwując jednak, że jest on dostępny na PDA inferuje, że raczej nie posiadają one wbudowanego DBMS.

Dostępność dla PDA oznacza jedynie specjalnie zoptymalizowaną stronę, dzięki czemu słownika można używać na niewielkich ekranach PDA, sam dostęp ciągle wymaga użycia przeglądarki.

apohllo napisał(a):
Mówiąc krótko - chciałbym mieć coś na kształt WordNetu, tylko, zawierającego mapowania w 2 językach...

Gdybym był złośliwy, to bym napisał: "Tak to tylko w Erze dopasują", ale nie będę ;)

apohllo napisał(a):
Acha - sprostowanie, jest jakieś middleware dla komórek - które najwyraźniej łączy się z webservicem, który jest na ich stronie. Hm... zatem pewnie to stoi na jakiejś bazie danych (swoją drogą słuszne rozwiązanie). No to wtedy jar mógłby nie wystarczyć ale, to nie ma w zasadzie większego znaczenia... (no chyba, że w tym jarze byłby instalator, który by wypluwał innego jara i tworzył bazę danych przenosząc do niej dane ze słownika - z resztą - nie ważne)

Problem w tym, że ten słownik jest słownikiem internetowym, więc jego engine jest zoptymalizowany do obsługi wielu równoczesnych zapytań, a więc jak większość tego typu aplikacji, używa zewnętrznej bazy danych i sporo zasobów systemowych (przede wszystkim RAM) więc samo zainstalowanie go na zwykłym desktopie właściwie mija się z celem...

apohllo napisał(a):
W każdym razie - dziękuję za uwagi i pozdrawiam.
Gdybyście słyszeli o tym o czym piszę, to proszę - dajcie znać.

A szukałeś na Sourceforge?
http://sourceforge.net/search/?words=di ... earch=soft

Na szybko znalazłem 2 listy słów i kilka różnych engine'ów... Poszperaj sobie po projektach, na pewno coś ciekawego znajdziesz.

Pozdr,
GZ

_________________
"I love deadlines. I love the whooshing noise they make as they go by." [Douglas Adams]


Góra
 Zobacz profil  
 
PostNapisane: 2006-01-22, 23:29 
Offline

Dołączył(a): 2005-12-29, 13:30
Posty: 11
Dzieki za pomoc, tym niemniej problem nadal pozostaje otwarty. Jakkolwiek istniej co najmniej kilka slownikow angielsko-polskich, ktore udostepniaja jakies sensowne API, to niestety zaden z nich nie posiada zasobow na poziomie srednim. Dla mnie najwazniejsze sa mapowania pomiedzy slowami i dodatkowa informacja gramatyczna. Czy slownik jest w bazie danych, w jarze, czy w pliku tekstowym, nie ma dla mnie znaczenia, bo jestem w stanie sam sobie napisac odpowiedni program, ktory korzystalby z tych zasobow.

W kazdym razie jeszcze raz dziekuje .


Góra
 Zobacz profil  
 
 Tytuł:
PostNapisane: 2006-01-23, 00:31 
Offline
Avatar użytkownika

Dołączył(a): 2005-01-13, 10:41
Posty: 4332
Lokalizacja: Poznań
Cytuj:
Czy slownik jest w bazie danych, w jarze, czy w pliku tekstowym, nie ma dla mnie znaczenia, bo jestem w stanie sam sobie napisac odpowiedni program, ktory korzystalby z tych zasobow.


No to kolego zakasaj rekawy i do pracy: wpisuj po kolei wszystkie slowa do edicta, kopiuj wyniki i zapisuj sobie w bazie lub pliku txt, az osiagniesz satysfakcjonujaca Cie ilosc hasel :twisted:

_________________
Tłumacz języka angielskiego
Katalog polskojęzycznych stron o tłumaczeniach


Góra
 Zobacz profil  
 
 Tytuł:
PostNapisane: 2006-01-24, 23:52 
Offline

Dołączył(a): 2005-12-29, 13:30
Posty: 11
Cytuj:
No to kolego zakasaj rekawy i do pracy: wpisuj po kolei wszystkie slowa do edicta, kopiuj wyniki i zapisuj sobie w bazie lub pliku txt, az osiagniesz satysfakcjonujaca Cie ilosc hasel


Zaiste nie stanowi to dla mnie wielkiego problemu. Swoja droga napisalem juz kiedys skrypt w perlu, ktory dokladnie cos takiego robil, wykorzystujac rozne slowniki internetowe. Dziwi mnie troche ironia rozmowcy. To doprawdy nic nadzwyczajnego. To co powstrzymuje mnie przed tego typu dzialanoscia to przede wszystkim kwestia praw autorskich. A poza tym po co mialbym sciagac e-dica po kawalku przez powiedzmy tydzien, gdybym mogl np. sciagnac go w calosci??? Doprawdy nie zalezy mi na tym zeby cos krasc. Dla mnie problem polega na tym, ze tego rodzaju slownikow (tzn. takich, ktore mozna by bezposrednio wykorzystac w jakims programie) ani w wersji darmowej, ani w wersji komercyjnej po prostu nie ma, co jest zjawiskiem co najmniej dziwnym, bo najlepszy (nie tylko moim zdaniem) slownik angielsko-angielski, czyli wordnet, nie dosc, ze jest rozprowadzany za darmo, to jeszcze udostepnia API dla roznych jezykow programowania (Java, Lispa i byc moze innych).
Smiem twierdzic, ze zawiera on wiecej hasel niz DICT, a do jego dzialania nie jest wymagana zadna zewnetrzna baza danych typu Oracle, MySQL, czy nawet HSQLDB.
Nie wspomne juz o CYC, ktore jest najwieksza dostepna powszechnie ontologia - zajmuje jakies 250 MB. Rowniez istnieje jego darmowa wersja, rowniez mozna go sobie sciagnac na komputer lokalny i rowniez udostepnia API dla Javy i Lispa (no i CycL, ale malo kto zna ten jezyk ;))

Reasumujac - nie stanowiloby dla mnie problemu sciganiecie DICT'a po kawalku. Myslalem, ze moze jest jego wersja (albo innego slownika tego typu), ktora pozwolilaby bez dodatkowego narzutu programistycznego wykorzystac go w innym projekcie (rzecz jasna z zachowaniem praw autorskich). Wyglada jednak na to, ze jestesmy jednak bardzo daleko za anglosasami, ktorzy rozdaja tego typu oprogramowanie za darmo. Skonczy sie chyba na tym, ze kupie sobie slownik PWN i dorobie do niego odpowiednie oprogramowanie pomostowe.


Góra
 Zobacz profil  
 
 Tytuł:
PostNapisane: 2006-01-25, 00:24 
Offline
Avatar użytkownika

Dołączył(a): 2004-03-22, 22:38
Posty: 1837
Lokalizacja: Zielona Góra
apohllo napisał(a):
Dla mnie problem polega na tym, ze tego rodzaju slownikow (tzn. takich, ktore mozna by bezposrednio wykorzystac w jakims programie) ani w wersji darmowej, ani w wersji komercyjnej po prostu nie ma, co jest zjawiskiem co najmniej dziwnym, bo najlepszy (nie tylko moim zdaniem) slownik angielsko-angielski, czyli wordnet, nie dosc, ze jest rozprowadzany za darmo, to jeszcze udostepnia API dla roznych jezykow programowania (Java, Lispa i byc moze innych).
Smiem twierdzic, ze zawiera on wiecej hasel niz DICT, a do jego dzialania nie jest wymagana zadna zewnetrzna baza danych typu Oracle, MySQL, czy nawet HSQLDB.

Porównywanie słowników en-en i en-pl jest moim zdaniem troszkę nie na miejscu... Słowniki en-en mają n razy więcej użytkowników niż słowniki en-pl, więc liczba osób zainteresowanych dostępem do danych słownikowych jest większa, czyli więcej jest potencjalnych rąk do pracy, więc łatwiej jest stworzyć coś darmowego...

Cytuj:
Wyglada jednak na to, ze jestesmy jednak bardzo daleko za anglosasami, ktorzy rozdaja tego typu oprogramowanie za darmo.

Faktycznie ktoś rozdaje tam coś komercyjnego ze słowników za darmo? Można jakiś link prosić? Bo chętnie bym obejrzał...

Cytuj:
Skonczy sie chyba na tym, ze kupie sobie slownik PWN i dorobie do niego odpowiednie oprogramowanie pomostowe.

Jeśli to na własne potrzeby, to właśnie coś takiego miałem zasugerować. Przed zakupem radzę jednak przeczytać licencję czy faktycznie kupujesz prawo również do danych, bo z tymi licencjami to różnie bywa. A z Twoich poprzednich postów wnioskuję, że starasz się przestrzegać praw autorskich, co się oczywiście chwali... :)

Pozdr,
GZ

_________________
"I love deadlines. I love the whooshing noise they make as they go by." [Douglas Adams]


Góra
 Zobacz profil  
 
 Tytuł:
PostNapisane: 2006-01-25, 01:29 
Offline
Avatar użytkownika

Dołączył(a): 2005-01-13, 10:41
Posty: 4332
Lokalizacja: Poznań
pwn oxford: polecam. jest zawsze pod ręką, wiec chyba to jest to czego szukasz.

CYC: mowisz o opencyc.org?

_________________
Tłumacz języka angielskiego
Katalog polskojęzycznych stron o tłumaczeniach


Góra
 Zobacz profil  
 
 Tytuł:
PostNapisane: 2006-01-25, 02:27 
Offline

Dołączył(a): 2005-12-29, 13:30
Posty: 11
Cytuj:
Porównywanie słowników en-en i en-pl jest moim zdaniem troszkę nie na miejscu... Słowniki en-en mają n razy więcej użytkowników niż słowniki en-pl, więc liczba osób zainteresowanych dostępem do danych słownikowych jest większa, czyli więcej jest potencjalnych rąk do pracy, więc łatwiej jest stworzyć coś darmowego...


Jasne, tym bardziej, że wordnet powstawał przez jakieś 20 lat i bez wątpienia był sponsorowany przez USA. Ponadto tworzyli go nie ochotnicy, tylko specjaliści najwyższej próby (może komuś znajome jest nazwisko GA Millera?). Ja nie mam pretensji do tworcow e-dicta, bynajmniej, mam raczej pretensje do wydawców takich jak chociażby PWN czy Ectaco, którzy nie dostrzegają w ogóle potrzeby tworzenia słownika z API. Po prostu dziwi mnie, a troche smuci to, że takie zapotrzebowanie wydaje się dziwne i zbędne.
Jak wcześniej pisałem (może trochę ogólnikowo), chciałbym zajmować się poważnie zagadnieniami przetwarzania języka naturalnego, w szczególności polskiego i brak podstawowych narzędzi niezwykle mi doskwiera. To jest pretensja raczej do władzy, że nie dostrzega się w ogóle takiego problemu, no bo w końcu w USA to rząd, no dobrze Princeton University, wydał odpowiednią kwotę na stowrzenie tego narzędzia. W Polsce natomiast moje pytania wywołują zdziwienie. I cóż począć?

Cytuj:
CYC: mowisz o opencyc.org?


Co do CYC owszem, mówię o opencyc oraz o researchcyc, gdyż ten drugi, jak wcześniej wspominałem posiada leksykon (czyli mapowanie odpowiednich konceptów na odpowiednie słowa) stworzony na bazie WordNetu. Jak już wcześniej pisałem - chciałbym wykorzystać ten leksykon oraz odpowiedni słownik angielsko-polski do stworzenia polskiego leksykonu dla CYC.
Proszę nie pytajcie mnie tylko, czy to jest możliwe. Dopóki nie mam odpowiedniego słownika angielsko-polskiego niewiele mogę powiedzieć na ten temat. Gdyby był odpowiedni słownik mapujący synsety z WordNetu na ich odpowiedniki w j. polskim, to całe zadanie byłoby trywialne. Podczas gdy nie ma jednak żadnego sensownego słownika, to zadanie jest niewykonalne.

Co do kwesti praw autorskich, to staram się przestrzegać. Tym bardziej jeśli wykorzystuję jakieś narzędzie do pracy naukowej... ;)


Góra
 Zobacz profil  
 
 Tytuł:
PostNapisane: 2006-01-25, 05:31 
Offline
Avatar użytkownika

Dołączył(a): 2005-01-13, 10:41
Posty: 4332
Lokalizacja: Poznań
rozumiem Twoja frustracje, ale chyba wiesz ze to iz projekt naukowy finansowany jest w USA nie znaczy ze podobny sfinansuja w Polsce... NLP ciekawy field, ale nigdy sie w niego specjalnie nie zaglebilem.
wracajac do edicta, to jest to slownik na biezaco aktualizowany, wiec jakakolwiek dystrybucja w 'zwartej' formie mija sie z celem, albo wymaga dostepu do zaktualizowanych danych, co w sumie tworzy bledne kolo :]

zalozmy ze masz slownik pwn-oxford. jak chcialbys sie dostac do niego? baza slowek to dwa enkryptowane pliki (wlasny format) win. jedyne co mi przychodzi do glowy to tylko wywolywanie okna slownika odpowiednim handlem po wskazaniu slowka w jakims texcie. :?

_________________
Tłumacz języka angielskiego
Katalog polskojęzycznych stron o tłumaczeniach


Góra
 Zobacz profil  
 
 Tytuł:
PostNapisane: 2006-01-27, 19:20 
Offline

Dołączył(a): 2005-12-29, 13:30
Posty: 11
Cytuj:
wracajac do edicta, to jest to slownik na biezaco aktualizowany, wiec jakakolwiek dystrybucja w 'zwartej' formie mija sie z celem


I tak i nie ;) Jest to zmora wiekszosci slownikow, gdyz jezyk jest tworem niezwykle zywym. Dlatego ciagla aktualizacja jest niewatpliwie potrzebna, no ale mozna tez stworzyc mechanizmy aktualizacji slownika, ktory pozwala scigac go na komputer lokalny - wazne jest to, ze tylko zmiany bylyby przesylane a nie caly slownik (synchronizowanie rozproszonych baz danych, jest zagadnieniem, ktore jest dosyc dobrze znane).

Cytuj:
zalozmy ze masz slownik pwn-oxford. jak chcialbys sie dostac do niego?


Istotnie, nie jest to zagadnienie banalne, no ale nie niemozliwe do realizacji. Tzn. trzeba by pogrzebac gdzies na poziomie komunikatow windowsowych, tak by zasymulowac uzytkownika, ktory wpisuje haslo w opowiednim okienku. Jesli bylaby wersja pod XWindow, to nawet wiem dokladnie jak to zrobic. Natomiast platforma M$ nie jest mi zbyt bliska, wiec w chwili biezacej nie moge podac dokladnego rozwiazania. Co nie znaczy, ze jest ono szczegolnie skomplikowane :)

Nie mam oczywiscie zamieru grzebac w kodzie zrodlowym slownika, czy tez w jego danych.


Góra
 Zobacz profil  
 
 Tytuł:
PostNapisane: 2006-02-01, 12:56 
Offline
Avatar użytkownika

Dołączył(a): 2005-01-13, 10:41
Posty: 4332
Lokalizacja: Poznań
tylko pytanie po co? skoro i tak potrzebujesz polaczenia z netem do aktualizacji albo do dostepu do bazy, to jaki jest sens tworzenia nowego programu zamiast szybiej i sprawnej strony www? sztuka dla sztuki owszem, ale jakies praktyczne zastosowanie?

_________________
Tłumacz języka angielskiego
Katalog polskojęzycznych stron o tłumaczeniach


Góra
 Zobacz profil  
 
 Tytuł:
PostNapisane: 2006-02-01, 21:27 
Offline

Dołączył(a): 2005-12-29, 13:30
Posty: 11
Cytuj:
tylko pytanie po co? skoro i tak potrzebujesz polaczenia z netem do aktualizacji albo do dostepu do bazy, to jaki jest sens tworzenia nowego programu zamiast szybiej i sprawnej strony www? sztuka dla sztuki owszem, ale jakies praktyczne zastosowanie?


Nadmienie, ze pisalem juz o pewnych uwarunkowaniach zwiazanych z tym zagadnieniem:

Cytuj:
A dlaczego webservice mnie nie zadowala. Hm, niech pomyślę, tłumaczenie 200000 słów mogłoby trochę zając, gdyby dla każdego trzeba by było zestawić połączenie http


Oto powody dla ktorych wolalbym miec wersje lokalna:

1. Dobrze jest moc pracowac nawet tam, gdzie nie ma dostepu do sieci

2. Kazdorazowe zestawianie polaczenia http jest olbrzymim narzutem, ktory moze byc pominiety. Zwroc uwage na to jak dzialaja realne systemy, wykorzystujace sieciowe repozytoria (jak np. emerge - gentoo). Synchronizacji dokonuje sie raz na jakis czas a nie nieustannie.

3. Zadanie, ktore planuje polega na jednorazowym wykorzystaniu slownika (tzn. kiedy uda sie opracowac odpowiednie algorytmy, dane przeniesione zostana do CYC i slownik juz nie bedzie potrzebny).

4. Potrzebne jest "ladne API", tzn. chcialbym dostac strukture (np. w ostatecznoscie XML'a, w idealnym przypadku odpowiednie klasy Javy), ktora opisuje powiazania pomiedzy wyrazami oraz ich rodzaj gramatyczny. Kiedy dane te sa na stronie WWW, to musze kazdorazowo parsowac jakas tabelke i z niej wyciagac odpowiednie dane. Jaka mam gwarancje, ze jej struktura sie nie zmieni? W przypadku XML'a mam przynajmniej DTD lub XMLS.

5. Jezyk nie zmienia sie na tyle szybko, zeby zmiany wprowadzane w slowniku on-line mialy byc natychmiast odzwierciedlane w moim systemie. Porownujac to z CYC czy wordnetem - tam nowe wersje publikowane sa najczesciej co kilka-kilkanascie miesiecy. Dlatego nieustanna synchronizacja ze slownikiem jest zupelnie bezcelowa.

W odpowiedzi na riposte, ktora sie pojawi - rozumiem, ze nieustannie dodajecie slowa, ktorych nie ma jeszcze w slowniku, a nie nowe zwroty z jezyka. Jednak na tym etapie mojego projektu - przed eksperymentalny! - potrzebuje glownie najczesciej stosowanych slow, ktore niewatpliwie juz najduja sie w slowniku.

Jako poparcie swoich tez przytocze fakt, ze zarowno Wordnet jak i CYC sa dostepne w wersji sieciowej, a kazdy z nich dystrybuowany jest rowniez jako wersja lokalna. Wlasnie dlatego, zeby umozliwic developement z ich udzialem. Gdyby wszyscy developerzy korzystali nieustannie z serwera Wordnetu, to przypuszczalnie zdechlby po miesiacu. Wlasnie przyklad tego slownika pokazuje, ze nie potrzeba miec nieustannie najswiezszej wersji - po prostu kolejne wersje maja istotnie szerszy zasob slow (np. w wersji 2.0 pojawily sie nazwy wlasne).


Jest jeszcze jedna kwestia, ktora byla poruszana we wczesniejszym poscie - wydajnosc. Pojawila sie informacja, ze DBMS na ktorym chodzi ten slownik nie poszedlby na przecietnym komputerze desktop, dlatego nie ma sensu rozpowszechniac wersjie desktopowej. Ten argument wydaje mi sie smieszny, bo mozna tak skonfigurowac DBMS zeby spokojnie ruszyl nawet na zacofanym sprzecie. W szczegolnosci jesli bedzie tylko jeden uzytkownik, ktory korzysta z tej bazy w danym czasie (tak sytuacja wygladalaby w moim przypadku). Dodam jeszcze, ze wymagania CYC wydaja sie znacznie wieksze niz waszego slownika - 1,5 GB ramu raczej nie jest popularna konfiguracja desktopowa, a jednak na moim sprzecie 0,5 GB sie uruchamia.

Jeszcze raz przypone, ze nie chodzi mi o to, zeby wykorzystywac slownik nieustannie - o ile uda sie opracowac odpowiednie algorytmy, to zadanie stworzenia leksykonu w j. polskim bedzie jednorazowe (na tym etapie bedzie potrzebny slownik ang-pol). Pozniej juz bedzie wykorzystywane wylacznie CYC, ktore bedzie zawieralo ten leksykon.
Moze schemacik cos rozjasni?

CYC + slownik ang-pol -> CYC z polskim leksykonem

Przy czym w "CYC z polskim leksykonem" nie korzystamy juz ze slownika.


Góra
 Zobacz profil  
 
Wyświetl posty nie starsze niż:  Sortuj wg  
Utwórz nowy wątek Odpowiedz w wątku  [ Posty: 20 ]  Przejdź na stronę 1, 2  Następna strona

Wszystkie czasy w strefie UTC + 1 [czas letni (DST)]


Kto przegląda forum

Użytkownicy przeglądający ten dział: Brak zalogowanych użytkowników i 1 gość


Nie możesz rozpoczynać nowych wątków
Nie możesz odpowiadać w wątkach
Nie możesz edytować swoich postów
Nie możesz usuwać swoich postów
Nie możesz dodawać załączników

Szukaj:
Skocz do:  
POWERED_BY
Przyjazne użytkownikom polskie wsparcie phpBB3 - phpBB3.PL