Obsah fóra www.novezahradnimesto.net www.novezahradnimesto.netPortál
 Nápověda  •  Hledat  •  Možnosti  •  Kronika  •  Soubory  •  Nové příspěvky  •  Digests  •  Registrace  •  Přihlásit pro kontrolu soukromých zpráv  •  Přihlášení
Kalendář 
Zobrazit následující téma
Zobrazit předchozí téma

Odeslat nové témaOdpovědět na téma Zobrazit předchozí témaPošlete e-mail kamarádovi.Seznam uživatelů kteří si prohlíželi tento příspěvekUložit téma do souboruPrintable versionPřihlásit pro kontrolu soukromých zprávZobrazit následující téma
Autor Zpráva
JoHnY
Administrator
Administrator


Věk: 31
Založen: 18.10.2005
Příspěvky: 2901
Bydliště: NZM G, Bratislava

european union1.png

PříspěvekZaslal: 6.4.2006, 21:47  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

Tak maximum co sa mi z toho podarilo dostat je toto: "bezpøedmìtné"
To ked prepnem do UTF8. Ked to prepnem na ISO-8859-2 alebo Win1250 tak to je uplne rozsypane.
Netusite niekto co s tymě Jak je mozne ze v ziadnom charsete sa henten text nezobrazi tak ako mač
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 27
Založen: 25.3.2006
Příspěvky: 1370
Bydliště: NZM "C" - North, Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 6.4.2006, 22:34  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
Pocuj, to nie je taky zly napad, udelujem ti zlatu plaketu D. Kunovskeho!
A co je este pozitivnejsie, pozeram dump tabulky nzm_search_wordlist a tam su vsetky tie slova v poriadku! Akurat ze netusim ake je to kodovanie atd. pretoze to je sejvnute v takomto formate nejakom:

INSERT INTO `nzm_search_wordlist` VALUES (0x383030, 1777, 0);
cize text je tam kodovany do hex values ale ked to importnem do tabulky co som vytvoril tak tam diakritika je (nie su otazniky) ale je rozbita. Skusal som dat collation tabulky cp1250 aj latin2 aj latin1, furt nic, stale je to nahovno.

Nemate chut niekto sa s tym pohrat a vyskumat ako treba nastavit tabulku/kodovanie/neviemco aby sa to do databazy importlo spravne?
respektive uplne by mi stacilo ak by ste to importli niekde k sebe so spravnou diakritikou a potom z toho vytiahli len tie slova a tie mi poslali v obycajnom textovom file...

ta tabulka je tu: http://www.novezahradnimesto.net/wordlist

A ked sa to podari tak je teda celkom slusna sanca ze sa podari obnovit tu diakritiku pretoze v tom wordliste by IMHO mali byt uplne vsetky slova ake sa tu kedy pouzili (je tam 41 tisic riadkov)


No zkousel jsem zadat nektery ty hexovy value sem:

http://www.cybermachine.org/

a pustit na to Hex 2 ASCII, ale stejně to vylezlo zmršený ...

např. 0x7679706fc3a8c3ad74c3a176c3a16e >> vypoèítává
Rak Pohlaví:Muž Opice OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávuOdeslat e-mailZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 27
Založen: 25.3.2006
Příspěvky: 1370
Bydliště: NZM "C" - North, Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 6.4.2006, 22:36  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

dcom napsal:
JoHnY napsal:
Pocuj, to nie je taky zly napad, udelujem ti zlatu plaketu D. Kunovskeho!
A co je este pozitivnejsie, pozeram dump tabulky nzm_search_wordlist a tam su vsetky tie slova v poriadku! Akurat ze netusim ake je to kodovanie atd. pretoze to je sejvnute v takomto formate nejakom:

INSERT INTO `nzm_search_wordlist` VALUES (0x383030, 1777, 0);
cize text je tam kodovany do hex values ale ked to importnem do tabulky co som vytvoril tak tam diakritika je (nie su otazniky) ale je rozbita. Skusal som dat collation tabulky cp1250 aj latin2 aj latin1, furt nic, stale je to nahovno.

Nemate chut niekto sa s tym pohrat a vyskumat ako treba nastavit tabulku/kodovanie/neviemco aby sa to do databazy importlo spravne?
respektive uplne by mi stacilo ak by ste to importli niekde k sebe so spravnou diakritikou a potom z toho vytiahli len tie slova a tie mi poslali v obycajnom textovom file...

ta tabulka je tu: http://www.novezahradnimesto.net/wordlist

A ked sa to podari tak je teda celkom slusna sanca ze sa podari obnovit tu diakritiku pretoze v tom wordliste by IMHO mali byt uplne vsetky slova ake sa tu kedy pouzili (je tam 41 tisic riadkov)


No zkousel jsem zadat nektery ty hexovy value sem:

http://www.cybermachine.org/

a pustit na to Hex 2 ASCII, ale stejně to vylezlo zmršený ...

např. 0x7679706fc3a8c3ad74c3a176c3a16e >> vypoèítává


ale tak me napada ... zkusim to importnout k sobe a pak vyexportovat ...
Rak Pohlaví:Muž Opice OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávuOdeslat e-mailZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 31
Založen: 18.10.2005
Příspěvky: 2901
Bydliště: NZM G, Bratislava

european union1.png

PříspěvekZaslal: 6.4.2006, 22:48  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

no skus to... ak by to slo tak by to bolo najlepsie riesenie
to by chcelo dakeho charset guru-a
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 31
Založen: 18.10.2005
Příspěvky: 2901
Bydliště: NZM G, Bratislava

european union1.png

PříspěvekZaslal: 6.4.2006, 22:51  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

inac to je presne to co mne z toho lezie... daj si to tam encodnut a potom si prepni kodovanie na UTF8 natvrdo v browseri... vylezie ti z toho nieco ako som sem ja pastoval... ze to vyzera aspon zhruba ako keby to chcelo byt spravne
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 27
Založen: 25.3.2006
Příspěvky: 1370
Bydliště: NZM "C" - North, Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 6.4.2006, 22:54  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
inac to je presne to co mne z toho lezie... daj si to tam encodnut a potom si prepni kodovanie na UTF8 natvrdo v browseri... vylezie ti z toho nieco ako som sem ja pastoval... ze to vyzera aspon zhruba ako keby to chcelo byt spravne


jasne ... no pohraju si s tim zejtra ...
Rak Pohlaví:Muž Opice OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávuOdeslat e-mailZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 31
Založen: 18.10.2005
Příspěvky: 2901
Bydliště: NZM G, Bratislava

european union1.png

PříspěvekZaslal: 6.4.2006, 22:56  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

ja idem tiez spat, nech zajtra vecer nieco vydrzim Very Happy
zatial bye
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
MUSTANG
Domácí
Domácí



Založen: 7.2.2006
Příspěvky: 755


czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 08:21  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

ja se taky muzu pokusit. Ted v praci se k tomu urcite nedostanu, ale muzu to zkusit odpoledne nebo pres vikend...
 Pohlaví:Muž  SkrytýOsobní galerie MUSTANGZobrazit informace o autoroviOdeslat soukromou zprávu
Milan V.
Administrator
Administrator



Založen: 25.4.2005
Příspěvky: 2062
Bydliště: NZM A

blank.gif

PříspěvekZaslal: 7.4.2006, 08:25  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

MUSTANG napsal:
ja se taky muzu pokusit. Ted v praci se k tomu urcite nedostanu, ale muzu to zkusit odpoledne nebo pres vikend...
Inu, proč ne, že ano. Pokud to dokážeš, o práci míň pro nás ... Wink
   OfflineOsobní galerie Milan V.Zobrazit informace o autoroviOdeslat soukromou zprávuICQ
JoHnY
Administrator
Administrator


Věk: 31
Založen: 18.10.2005
Příspěvky: 2901
Bydliště: NZM G, Bratislava

european union1.png

PříspěvekZaslal: 7.4.2006, 10:27  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

no pocuvajte najdite medzi sebou dakeho character-set-mysql gurua lebo ja sa vzdavam, absolutne tomu nerozumiem a tam sa ten character set nastavuje na tolkych miestach ze to musel vymyslat nejaky ...
aktualne som chcel zmenit character set pre tabulku attachmentov lebo tam diakritika tiez bola ale daka divna, ked to zmenim tak su tam hned otazniky, a ked to zmazem, zmenim a znovu importnem tak je to furt rozhadzane
a tych moznosti ako a kde nastavit charset je tolko ze keby som to mal skusat tak to mam na mesiac prace.
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
MUSTANG
Domácí
Domácí



Založen: 7.2.2006
Příspěvky: 755


czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 10:46  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

hm, tak to je zle, vypada to, ze pri kazde akci se bere v potaz jina konfigurace. Tyhle free udelatka jsou dobry, kdyz se nainstalujou a nechaj bejt a nesaha se na ne a nic se jim nahodou nestane Sad. Bohuzel soudruzi vyvojari jsou vetsinou ze zemi, kde o diakritice nikdo moc nepremysli, vzdyt ji pouziva jen par pidinarodu na druhym konci sveta Smile

Moc se mi ale nezda, ze by zmena konfigurace okamzite vyvolala update dat. To je bud nejaky omyl, chyba nebo to vymyslel nejaky tululum. Na databazi o std. velikosti by si taky mohl vzit par dni dovolenou Smile a cekat az se to zupdatne. nemuzu si pomoct ale tomu neverim. kdyz zmenis konfiguraci DB a nezmenis klienta tak to muze byt vevnitr porad dobre ale po vyselektovani/exportu/dumpu to muze byt spatne (diky standardni konverzi mezi enforceovanym charsetem DB files a klienta). Zkusil sis DB soubory prohlednout primo binarnim editoremě
 Pohlaví:Muž  SkrytýOsobní galerie MUSTANGZobrazit informace o autoroviOdeslat soukromou zprávu
JoHnY
Administrator
Administrator


Věk: 31
Založen: 18.10.2005
Příspěvky: 2901
Bydliště: NZM G, Bratislava

european union1.png

PříspěvekZaslal: 7.4.2006, 10:50  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

problem je zrejme v tom ze ja som to zmenil sice len v konfiguracii servera, lenze ako board bezal tak tam sli nejake updaty/altery/neviemco ktore to znicili...
pretoze tabulky ktore sa nevyuzivali (ako napriklad ta tabulka attachmentov) su v pohode, ale to ostatne je dodrbane
takze to bude najskor ten problem
to uz je ale jedno, terat treba vymysliet ako to napravit
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 31
Založen: 18.10.2005
Příspěvky: 2901
Bydliště: NZM G, Bratislava

european union1.png

PříspěvekZaslal: 7.4.2006, 11:14  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

pozeram znovu ten wordlist a tam pre znaky s diakritikou su dve hex values. to znamena ze to je v utf, nie? teda ako vravim, v tomto som uplne mimo ale z toho co som pochopil teraz co som cital tak utf pouziva pre znaky 128-32767 prave dve hex hodnoty. je to taKč
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
MUSTANG
Domácí
Domácí



Založen: 7.2.2006
Příspěvky: 755


czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 11:16  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

muze to byt obecne jakakoli forma Unicode, BigEndian/LittleEndian

http://www.unicode.org/faq/utf_bom.html
 Pohlaví:Muž  SkrytýOsobní galerie MUSTANGZobrazit informace o autoroviOdeslat soukromou zprávu
JoHnY
Administrator
Administrator


Věk: 31
Založen: 18.10.2005
Příspěvky: 2901
Bydliště: NZM G, Bratislava

european union1.png

PříspěvekZaslal: 7.4.2006, 11:24  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

MUSTANG napsal:
muze to byt obecne jakakoli forma Unicode, BigEndian/LowEndian


no ano, tak som to myslel, len mi nedoslo najprv ze to bude _nejaky_ unicode
a da sa teda nejako zistit co to je a previest to do rozumnej formy?

ja zacinam rozmyslat nad tym ze spravit to uplne jednoducho, tych diakritickych znakov je zopar, pozriet aku hodnotu ma kazdy v tom hex, a nahradit tie dve values jednou v cp1250
to bude asi najjednoduchsie, nie?

nech zhoria v pekle ti co vymysleli diakritiku
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnYZobrazit informace o autoroviOdeslat soukromou zprávuZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 27
Založen: 25.3.2006
Příspěvky: 1370
Bydliště: NZM "C" - North, Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 11:33  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

JoHnY napsal:
MUSTANG napsal:
muze to byt obecne jakakoli forma Unicode, BigEndian/LowEndian


no ano, tak som to myslel, len mi nedoslo najprv ze to bude _nejaky_ unicode
a da sa teda nejako zistit co to je a previest to do rozumnej formy?

ja zacinam rozmyslat nad tym ze spravit to uplne jednoducho, tych diakritickych znakov je zopar, pozriet aku hodnotu ma kazdy v tom hex, a nahradit tie dve values jednou v cp1250
to bude asi najjednoduchsie, nie?

nech zhoria v pekle ti co vymysleli diakritiku


"nech zhoria v pekle ti co vymysleli diakritiku" tak s tim nelze nez souhlasit Laughing Razz Cool
Rak Pohlaví:Muž Opice OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávuOdeslat e-mailZobrazit autorovy WWW stránkyICQ
dcom
Starousedlík
Starousedlík


Věk: 27
Založen: 25.3.2006
Příspěvky: 1370
Bydliště: NZM "C" - North, Prague, CZ

czechrepublic.gif

PříspěvekZaslal: 7.4.2006, 11:36  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

jinak nainstaloval jsem si na testovacim stroji phpmyadmina a zkousim to opravit ...
_________________
http://www.d-netlabs.net/
http://www.d-netlabs.info/
http://www.securityonline.cz/
Rak Pohlaví:Muž Opice OfflineOsobní galerie dcomZobrazit informace o autoroviOdeslat soukromou zprávuOdeslat e-mailZobrazit autorovy WWW stránkyICQ
JoHnY
Administrator
Administrator


Věk: 31
Založen: 18.10.2005
Příspěvky: 2901
Bydliště: NZM G, Bratislava

european union1.png

PříspěvekZaslal: 7.4.2006, 11:40  Předmět:   Odpovědět s citátemSpodní část stránkyNávrat nahoru

a este nacrtnem moje riesenie ked sa podari vyriesit to kodovanie v tom fajle.

takze, mam aj povodnu tabulku nzm_search_wordmatch, co znacne zjednodusi pracu, cize by som to spravil takto nejako:


PHP:
<?php mysql_connect('localhost','login','heslo');
mysql_select_db('databaza');
 
$sql='SELECT post_id,post_text FROM nzm_posts_text';
$result=mysql_query($sql);

 while (
$row=mysql_fetch_array($result)) {
   
$sql2='SELECT nzm_search_wordlist.word_text FROM nzm_search_wordlist,nzm_search_wordmatch WHERE nzm_search_wordmatch.word_id=nzm_search_wordlist.word_id AND nzm_search_wordmatch.post_id={$row['post_id']}';

    
$result2=mysql_query($sql2);
    while (
$row2=mysql_fetch_array($result2)) {
       
//tu sa nejako matchnu slova s otaznikmi z $row['post_text'] s $row2['word_text'] a replacnu sa
    
}
?>


je to rozumne alebo je to uplna blbost?

a treba vymysliet daky regexp na to replacovanie a este vo word_texte je vsetko lowercase cize aj na to treba nejako dat pozor


Naposledy upravil JoHnY dne 7.4.2006, 11:44, celkově upraveno 2 krát.
Vodnář Pohlaví:Muž Drak OfflineOsobní galerie JoHnY