<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>IT blog &#187; seznam</title>
	<atom:link href="http://szj.cz/tag/seznam/feed/" rel="self" type="application/rss+xml" />
	<link>http://szj.cz</link>
	<description>internet, linux, novinky, programování</description>
	<lastBuildDate>Sat, 12 Sep 2015 11:14:32 +0000</lastBuildDate>
	<language>cs-CZ</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=4.2.2</generator>
	<item>
		<title>Seznam českých podstatných jmen</title>
		<link>http://szj.cz/seznam-ceskych-podstatnych-jmen/</link>
		<comments>http://szj.cz/seznam-ceskych-podstatnych-jmen/#comments</comments>
		<pubDate>Sun, 07 Oct 2012 14:07:38 +0000</pubDate>
		<dc:creator><![CDATA[fredomgc]]></dc:creator>
				<category><![CDATA[Ostatní]]></category>
		<category><![CDATA[PHP]]></category>
		<category><![CDATA[podstatná jména]]></category>
		<category><![CDATA[podstatné jméno]]></category>
		<category><![CDATA[seznam]]></category>
		<category><![CDATA[slovník]]></category>

		<guid isPermaLink="false">http://szj.cz/?p=441</guid>
		<description><![CDATA[K naplnění podstaty jednoho mého projektu jsem potřeboval získat poněkud specifická data – česká podstatná jména v prvním pádě. Nejprve jsem předpokládal, že podobný seznam musím s pomocí webového vyhledávače nalézt. Bohužel jsem však narážel pouze na nefunkční odkazy. Postupně jsem se proto smiřoval s faktem, že kýžený soupis budu vytvářet na vlastní pěst. Mé [&#8230;]]]></description>
				<content:encoded><![CDATA[<p><a href="http://szj.cz/wp-content/uploads/2012/10/seznam-podstatnych-jmen.png"><img class="alignleft size-full wp-image-445" title="seznam-podstatnych-jmen" src="http://szj.cz/wp-content/uploads/2012/10/seznam-podstatnych-jmen.png" alt="Seznam podstatných jmen" width="128" height="128" /></a>K naplnění podstaty jednoho mého projektu jsem potřeboval získat poněkud specifická data – česká podstatná jména v prvním pádě. Nejprve jsem předpokládal, že podobný seznam musím s pomocí webového vyhledávače nalézt. Bohužel jsem však narážel pouze na nefunkční odkazy. Postupně jsem se proto smiřoval s faktem, že kýžený soupis budu vytvářet na vlastní pěst. Mé myšlenky směřovaly k využití nejrůznějších slovníků používaných pro kontrolu pravopisu a tento nápad mi následně potvrdil i jeden tip, jenž jsem během procházení internetu objevil.</p>
<h2>Problémy nečiní ani jiné slovní druhy</h2>
<p>K získání seznamu nejprve zamiřte na <a href="http://www.openoffice.cz/stahnout/doplnky/cesky-slovnik">www.openoffice.cz</a>, kde stáhnete český slovník ve formátu <strong>oxt</strong>. U souboru následně zaměňte koncovku na <strong>zip </strong>a použijte libovolný dekomprimační nástroj. Uvnitř archívu čeká několik souborů, z nichž pro nás momentálně nejzajímavější nese označení <strong>cs_CZ.dic</strong>. Doporučuji se rovněž seznámit s přiloženou licencí. Zmíněný souhrn pochází původně ze slovníku pro <strong>ispell</strong> a přichází s formátem, jenž umožňuje identifikovat kýžené objekty zájmu. Pro tento účel jsem vytvořil jednoduchý skript v PHP, jenž celý soubor postupně projde a vybere pouze ta slova, o které má daný uživatel skutečně zájem. V mém případě šlo o řádky, jenž za symbolem lomítka (<strong>/</strong>) obsahovaly buď znak <strong>H</strong> nebo <strong>Z</strong>.</p>
<pre class="brush: php; title: ; notranslate">
$lines = file(&quot;./cs_CZ.dic&quot;);
$fileName = &quot;podstatna_jmena.txt&quot;;
for($i = 0 ; $i &lt; count($lines); $i++)
{
 $currentLine = explode(&quot;/&quot;, $lines[$i]);
 if( (strpbrk($currentLine[1], &quot;HZ&quot;) != false) )
 {
 file_put_contents($fileName, $currentLine[0].&quot;\n&quot;, FILE_APPEND);
 }
}
</pre>
<p>Nejprve jsem celý obsah slovníku s pomocí funkce <strong>file</strong> proměnil na pole. Následovalo jeho procházení s pomocí klasického iteračního cyklu. Na každý řádek byla aplikována snaha o jeho rozdělení na dvě poloviny díky <strong>explode</strong>. Pokud funkce <strong>strpbrk</strong> nalezla kýžený písmenný znak, dovolila provést zápis do druhého pomocného souboru. Po ukončení činnosti scriptu jeho obsah tvořily pouze slovní druhy, o něž skutečně stojíte &#8211; zde tedy konkrétně výhradně podstatná jména. Jejich předání dalšímu programu či scriptu následně již nic nezabrání.</p>
<h4>Příchozí dotazy:</h4><ul><li>slovník podstatných jmen</li><li>seznam podstatných jmen</li><li>seznam českých slov</li><li>slovník českých slov txt</li><li>databáze českých slov</li><li>česká podstatná jména</li><li>seznam českých podstatných jmen</li></ul>]]></content:encoded>
			<wfw:commentRss>http://szj.cz/seznam-ceskych-podstatnych-jmen/feed/</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
	</channel>
</rss>
