◎正当な理由による書き込みの削除について: 生島英之とみられる方へ:
構造化テキスト
動画、画像抽出 ||
この掲示板へ
類似スレ
掲示板一覧 人気スレ 動画人気順
このスレへの固定リンク: http://5chb.net/r/unix/1124809360/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。
SGML/XML 系
--------------
DocBook
http://www.docbook.org/ SmartDoc
http://www.asahi-net.or.jp/~dp8t-asm/java/tools/SmartDoc/index_ja.html
Simple Outline XML: SOX
http://www.langdale.com.au/SOX/ 明示マークアップ系
--------------
Scratch -- A Simple Text Formatting Processor
http://scratchml.sourceforge.net/ Textism Tools Textile
http://www.textism.com/tools/textile/ >>4 TeX(というかLaTeX?)は明示マークアップ系だと思いますが、
専用スレが存在しているので引き合いに出す程度が無難かなーと思います。
pdf 化の過程で LaTeX に一回落とす処理系は割と多そうなので、ほっといても関連しますので。
とりあえず単発だろ
参照サイトとかを提示すればいいってもんじゃないんだぞ
削除依頼だしてこいな
他力本願ならそれなりに踊ってみせろやといいたい
unix のゆの字もはいってねーしな
>>7 人が真面目に立てているのに取り合えずで片付けるのは失礼じゃないですか?
単発系のスレでこれだけのリンクをはって単発質問として発言した場合のことを少しでも想像して発言してますか?
脳髄反射な削除発言は自治じゃなくて自治厨だと思います。
>>8 踊れるなら初めから自分で(ry
で、板違いだというならどの板に立てればいいのでしょうか。
ソフトでもあるし、UNIX 由来のTeX, roff と一緒に語られることもあるし、Wiki や Blog の記法としてWeb系の板で語られることもあるし。
最終的にUNIX板にしたのはGoogleで各ツール名で検索したら Unix/Linux の2板が多かったからです。
何らかの妥当な根拠を持って他の板に誘導してください。
あれだ、ピロユキにたのんで「構造化板」作ってもらえば、ばっちり。
>>9 そういうのにいちいち反応してたらきりないですよ。
で。
Linux板にDocBookスレがあるけど、いまいち伸びてない。
他にメジャーは構造化テキストとなると TeX くらい?
HTMLは「構造」なのか、と言われると微妙だし。
という現状で、総合スレを普通に伸ばそうと思ったら、
1 の方向付けが鍵なのは確か。
専用スレのないフォーマット全般を扱うつもりなのか、
各フォーマットの比較みたいなことをやるのか。
Wiki記法とか、PODやらRDも立派な構造化テキストだろう。
個人的には、smart ascii 系がdiffしたり、cvsしたりするのに便利なので好き。
まぁ、unix板でいいんじゃないの。diffだのcvsだのgrepだのできて
喜ぶ連中がunix板以外にたくさんいるとは思えないし。
Linux板に立てた方がまともに進行するかもな。残念な話だが。
>>6 了解
>>15 あっち見てないのでここの方が嬉しい
>>11 > 専用スレのないフォーマット全般を扱うつもりなのか、
> 各フォーマットの比較みたいなことをやるのか。
正直どっちもやりたい(^^;
そんなに盛り上がらないだろうから話題を制限してもね。。。
>>12 WORD 等の文書は素材として使おうとするとすげーめんどくさいです。
sed とか awk とか perl とかでプログラマブルに加工できるのはすんげー魅力的です。
>>16 同意です。
明示的なマークアップはソフトウェアの処理に向いているのでiff(interchange file format)としては良いのですが、
人にはやさしくありません。。。
>>18 > 明示的なマークアップはソフトウェアの処理に向いているのでiff(interchange file format)としては良いのですが、
> 人にはやさしくありません。。。
確かに。
そこでWikiのような簡易記法が出てくるんだろうね。
Wiki のような smart ascii 系も、明示的なマークアップでしょ
読み手としては HTML/XML 系より読みやすいけど、書き手としては至極面倒。
なにより覚えにくい
入りやすさという意味では、HTMLみたいに特殊記号使う方がいいだろうね
マークアップしてるかしてないかが明確
>>20 Texinfoなら一応構造化テキストに入ると思うけど。
ネタが無いスレなのでいいんじゃない?
>>21 wikiはたしかに方言が多く統一感も無くて混乱するし、HTTPの制限からUIがダメダメで
書きにくいと感じていたけど、howmとかを使い込んで考えがかわったよ。
ていうか、マークアップしてるかしてないか明確なものがhtml/xml/texで、
その点に注目して明示的マークアップ系とsmart ascii系を分類したのじゃないのか。
smart asciiが明示的マークアップと一緒と思うのはどういう点で同一と感じるのさ?
>>23 変換後にどうマークアップされるかを思い浮かべると同じだと感じる。
>>24 変換するなら変換後のフォーマットの話であって、それは変換前の
フォーマットとは関係ないだろ?
>>24 一般的にはそうだね。
>>23の前半でwikiの話をしていたので、
>>24ではそれが
念頭にあった。wikiはHTMLにしかしないから。そう断っておくべきでした。
構文でマークアップするかタグでマークアップするかでしょ。
そんなに違いはないように感じる。
Smart Ascii系と明示マークアップ系だと、書く量と文書の表現力がだいぶ違わないか?
構文にオプションや属性を指定する節なんかを定義する事はできるだろうが、
Smart Ascii系でそういうのってあんまり使われてないよねぇ?
=head1 POD
perlのB<POD>はどうよ。
=head2 書き易さ
Wikiと同じくらい。覚え易さもWikiと同じくらい。
=head2 汎用性
man、html、texinfo、TeXなんかに変換するのは楽だけど
YAMLのような汎用性は無い。
=cut
テキストファイルとしてメモ帳クラスのアプリでも編集することを前提とした
構造化テキストのフォーマットとしては、Wikiスタイルが今のとこベスト?
あー、構造化テキストとは言わないな・・・
すまん忘れてくれ
smartdoc 派なオレがきましたよっと。
http://www.xmlsmartdoc.org/ メリット
. xml なので、多い日も安心
. 数式を書くのが楽(TeX互換)
. 日本語OK
. tex, html, plain text変換
デメリット
. xmlなので、そのままでは読みにくいかも
. xmlなので、タグ書き面倒(HTMLと大差ないレベル)
. 便利に使い込もうと思うと、java, make(or ant) などの知識必須
. 凝ったPDFを出力しようと思ったら、それなりにTeXの知識がいる
TeXに慣れてるひと(書き貯めたスタイルファイルを無駄にしたくないとか、
数式はTeXじゃなきゃ書けないとか)が将来の文書ハンドリングの利便性に
不安を感じたときにオススメ
SmartDoc は一時期使ってみたけど、いまいちだった
・閉じタグ必須で入力がHTMLの倍は面倒
・表現力が低い。パラグラフと箇条書きだけの文書なら使えるかもしれない
・一個の記述が複数のHTML記述に対応するとかの便利さもない
・図のサポートがいまいち。
やっぱり、はじめからLaTeXで書いた方が綺麗だし何より早いと思う
ま−でも、こういう自分言語って作る方は楽しいんだろうね
同じくsmartdoc派な俺も来ましたよ。
いままで書く所無かったんだよ。
俺の感想はだいたい
>>33-34と似たようなものだな。
・レイアウトを凝る必要が無い。
・テキストが多い。
というのに向いてそう。
思うに、タグ型のフォーマットは、それなりのオーサリングツールに
支援して貰うのが前提な希ガス。
smartdoc 程度ならエディタ補完とxmlタグ閉じプラグインで十分な希モス
Docutils
http://docutils.sourceforge.net/ Purpose
The purpose of the Docutils project is to create a set of tools for
processing plaintext documentation into useful formats, such as
HTML, XML, and LaTeX. Support for the following sources has been implemented:
だそうな。
lighttpdのページを見てて発見した。
reStructuredText の機能を含むが、wiki markupやらRFC822な
メールファイルにも対応してるそうだ。
Pythonなのが俺的に微妙だけど、ちょっくら試してみる。
>>33 俺は最初からSmarDocファイルで文書のレイアウトをするのはあきらめてるから。
細かいレイアウトをしたい時は生成されたLaTeXファイルを直接編集してdiffをとっとく。
sdoc文書を編集した時も、たいていはpatchで何とかなる。
...という一連の作業をMakefileで自動化しているので、なかなか快適で離れられない。
まぁデメリットに関しては
>>33 の言う通りかと思う。とくにインライン数式が面倒すぎ。
ともかく、sdocにあまり文書のレイアウト情報は入れない方が精神的にも楽。
表現力は低くても、テキストファイルとして自然に読み下せる記法が欲しいな。
Wiki のフォーマットだと、「変換前のファイル」という風味が強すぎるんで。
Markdown が良さそうだけどね。
後はRDとか。
・・・どっちもテーブルサポートがない奴だな(w
結局メジャーどころのマークアップ言語が一通り挙がったところで終わったな。このスレ。
こんなの情報整理スレでやってりゃ良かったんだよ。
昔akr先生が「構造化文書の記法」なる文書を書いていたのだが、いつのまにか
なくなってしまったので参照先はWayback Machine。
http://web.archive.org/web/20041011165213/http://cvs.m17n.org/~akr/markup
http://www.pault.com/pault/pxml/xmlalternatives.html ますます、増えてないか。。。
マークアップのデファクトは DocBook な気がするけど、Smart ASCII のデファクトは決まらないのかなあ。。。
OASIS Darwin Information Typing Architecture (DITA) ってどう?
>>59 正直微妙(w
あまりにも記号的すぎて自然な感が弱い。
コメントサンクス
>自然な感が弱い。
自然な感じだと、reStructuredText使うのが素直でしょうね……アレには敵わん。
ただ、あれだと後戻りが多くてパースするのが大変な気がするけど……どうなのかね?
asciidoc が cygwin に入りますた.
軽量ワープロとしてWYSIWYGで編集できるWindows用のツールなんてありませんか?
こんなスレあったのね…
お手軽メモ書きに使って
打ち合わせ資料とかでそれっぽく変換できる
日本語をそれなりに扱える
いまのところ python 関連ということもあって
reStructuredText (docutils)使おうと思ってるんですけど
最近イケてるのって何かあるんですかね?
reST のさらに wrapper で kagipdf なるものも発見
(↑とりあえず日本語文書を扱うための wrapper みたいなもん?)
>>68 構造化テキストで!><
欲を言うならWinとLinuxでファイルを相互更新できたらいいな
そのスレ、内容はともかくグロ画像貼ってあんのはヒドイ
これだからマクド使いは、、、
で、現状最有力は結局XMLなの?
早くデファクトスタンダードが決まって欲しい
今更ながら Smart ASCII 系に「xetext」も。
setext-j を微拡張した感じ。とん挫した残骸みたいだけど
http://www.piedey.co.jp/xetext/ (ページの一番下です)
reStructuredText で用語集を作ろうと思ったんだけど、
自動的に<dt>にアンカーをつける方法ってないのかな。
↓こんな風に書けば望み通りの出力が得られるんだけど、
定義名とアンカーで2回exampleを書くのがいやだ…
example_ は例です。
.. _example:
example
説明
これだけでリンクが張られてくれるとベスト。
example_ は例です。
example
説明
reStructuredTextは、出力弄るのがちょっと面倒だよな。
xmlで出して変換しろって言うけど、そっちもやっぱり面倒で。
wiki フォーマットで書いて、ツールで見やすい形式のテキストに
変換するのが良いんじゃないかと思えて来た。何と言っても wiki
フォーマットは書く為のフォーマットであるというのがグッド。
XML みたいに入力量が増えたりしないし、そのくせ適度に構造化
されているし、インデントが適当でも後で幾らでも整形出来るし、
HTML に変換するのも容易いし、勿論 wiki にもアップ出来る。
特殊なエディタのサポートを必要としないと言うのも良いね。
後は wiki->txt のツールをちょちょっとでっち上げれば完了。
問題があるとすれば、どの wiki フォーマットを使うかかな。
お好きなのドゾー
1. reStructuredText
2. plain2
3. 自分で作る
おいらは自作したけどね。RubyでもreStructuredText使えればなぁ。
ruby でもっていうか
docutils をsystem()みたく呼べばいいだけってことではないの?
さすがにめんどかった。
それに文脈自由文法にも興味あったんで、勉強がてら俺構造化テキストを設計してみました。
まあ、RDがあまりにもアレ過ぎるっつうのもあったんだけどね。
- 見出しの中で最大見出しが一番目立たない記法ってのはおかしいだろ。
- 整形ずみ文書を字下げで表現するのはいかがなものか。エディタの支援必須になっちゃうよね。
- ((●●●))というのが多過ぎ。「見た目の装飾」と「リンク」ぐらいは分けた方が良かったと思う。
とか。
そういえば昔まとめた解説を発掘したんだけど、文法についてコメント頂けますか?
・ここをこうすればLL(1)になるんじゃね?
・これだとこういう組合せで破綻するよ
とか教えて貰えると助かります。
http://fiercewinds.net/siki/pub/Siki/SikiFormat/ >>82 > 記述や修正に手間のかかることが多いです
俺も RST の問題はここだと思う。
Wiki 書法よりも読み易さを重視した結果だろうけど。
RST って ReST (reStructuredText) のこと?
いや、RST は reStructuredText の事だよ
RST -->
http://docutils.sourceforge.net/rst.html (reStructuredText)
REST -->
http://ja.wikipedia.org/wiki/REST (Representational State Transfer)
>>85 拡張子は3文字信仰が多いから rst だけど、普通 reStructuredText を RST とは言わない.
ReST、reSTなどで大文字小文字で判別する.
>>86 そんな事どうでも良くない?
もしかして何でも決めつけたがりの人?
普通っていうほど普及してるもんでもないし、拡張子の話は誰もしていないし、
公式の URL は rst.html だし、ついでに言えばディレクトリも rst になっているし、
reStructuredText の仕様書中の例題も RST という略号を使用しているし、
Wikipedia でも一番最初に RST と書いてある。だから普通なのはむしろ RST
なんだと思うけど、君が ReST や reST と書いても俺は何の文句も言わないよ。
だって、こんな些細な事、普通はどうでも良いからね。
http://docutils.sourceforge.net/docs/ref/rst/restructuredtext.html > |RST|_ is a little annoying to type over and over, especially
> when writing about |RST| itself, and spelling out the
> bicapitalized word |RST| every time isn't really necessary for
> |RST| source readability.
>
> .. |RST| replace:: reStructuredText
> .. _RST:
http://docutils.sourceforge.net/rst.html http://ja.wikipedia.org/wiki/ReStructuredText > reStructuredText は RST、reST、ReST と略されることもある。
それよりももっと意味のある話をしようぜ。
どうせ2chなんだから、疑似問題が発生しない程度に判りゃ良いよ。
もともと日本語って読み手・聞き手が文脈から意味を補足するのを前提にしている言語だし。
#述語中心の構成とか
そんなことよりも>82の評価 or もっと優れた構造テキストとの比較ヨロ
>87=85 が 「4文字で書くな」と決めつけたのが
発端なのに真っ赤になって書くから…
というのはさておき
------
所詮 plain text なんだから章題を「目立たせる」方法ってそんなにないので
その辺りはあまり拘っても仕方ない気がする
ReST ってガンガン書いて自分なりのルールが決まればいいんだろうけど
第何番目のレベルはどの記号だったっけ? とかがビミョ〜に面倒
(第 n.m.k 節 って書き方を auto-numbering 出来ればちょっと楽かもしれない)
あとリストの入れ子について、インデントレベルを気にして書くのも
チョイ面倒だったかな(やり方を勘違いしているのかもしれないが)
>>89 >「4文字で書くな」と決めつけたのが発端
(・∀・)ニヤニヤ
>>85 を見れば明らかに決め付けたがりの人がどっちかは明らかだよな
yes といえばいいだけのところでわざわざ RST じゃなきゃと言わんがばかりに主張してるんだから
ついでに Google の結果
reStructuredText rest の検索結果 約 98,300 件中 1 - 10 件目 (0.22 秒)
reStructuredText rst の検索結果 約 74,400 件中 1 - 10 件目 (0.27 秒)
reST が当たり前だというほどではないけど、rst の方が少数派なのは確かっぽい
おまいら省略形禁止。reStructuredTextて書け。
>所詮 plain text なんだから章題を「目立たせる」方法ってそんなにないので
reStructuredTextは目立っていると思うよ。
#とか$とかの字面の黒い文字使ってさらに強調する手もあるけど、あれで十分じゃない?
ただ、指摘の通りアシストツールがないと結局書けなくなるよな。
参考書片手でもいいけど、そうなるとお手軽さが無くなるし……
そういや全然別の話だけど、reStructuredTextて文脈自由文法に納まっていたっけ?
>>91-92 > 明らかに決め付けたがりの人がどっちかは明らか
そんなに真っ赤になって書かなくても良いよ
もう諦めたら?
>>92 ついでに rest は使用頻度の高い一般名詞でもある
Google の検索結果を鵜呑みにせず、そういう所にも気を使おう
過疎ってるなー
reStructuredTextのラッパ(?)でsphinxというのが出てきたそうな。
http://sphinx.pocoo.org/ python2.6のドキュメント↓もsphinxを使ってるんだと。
http://docs.python.org/dev/ reStructuredTextからのpdf生成がもっと簡単に(latexに頼らずに)
できるようになったら、自分で文書書くときはwordと決別できそう
なんだけど…
reStructuredTextよりもasciidocの方が良い気がしてきたぞ…
最初から数式が使えるし、次のバージョンでは
要求仕様/設計結果対照表みたいな左右に並べるテーブルを
簡単に記述できるようになるみたいだし。
どっちもpythonで書かれているし、いっそのこと統合して欲しいもんじゃ。
asciidocってreStructuredTextなんだと思ってた・・・
ニホンゴ(EUC? UTF8?)は使えるんでしょうか?
infoみたいにemacsから容易に利用できかつ画像とか埋め込めるフォーマットねぇかなぁ
pdfはいまいち使いにくいんだよね
pandoc 使え pandoc
html, markdown, reStructuredText あたりを読み込んで、
html, markdown, reStructuredText, pdf, LaTeX, DocBook XML その他
もろもろに変換できる、スグレもの。
http://johnmaxfarlane.net/pandoc/ ニホンゴは?
utf8 で処理するって書いてあるけど
pdf とか latex とかはどうなるの?
俺はこの組み合わせ
asciidoc(原稿)+XSLT(デザイン)
このスレ読んでpandocが気になった。
また古いスレ上がってんな。smartdocとか懐かしいな。流石にもう誰も使ってねーよなw
>107
すまんな、Asciidocに絡む案件があったのでageたくなったんだ
htmlファイルを読み込んで、構造を表示してくれるようなアウトラインプロセッサが欲しい…
asciidocベースで個人サイト構築作業してるけど、Pandoc使いたくなってきてしょうがない。
というかもう設定ファイル見飽きた…高機能だけど無駄にHTML汚いし…そもそもちゃんとXMLパースしろよ…
ずいぶん過疎っていますがrst2pdfの話題とかもここでいいのでしょうか?
好きな話を好きなだけすればいい
ネタが全くない状態だし
>大阪府三島郡島本町の小学校や中学校は、暴力イジメ学校や。
島本町の学校でいじめ・暴力・脅迫・恐喝などを受け続けて廃人同様になってしもうた僕が言うんやから、
まちがいないで。僕のほかにも、イジメが原因で精神病になったりひきこもりになったりした子が何人もおる。
教師も校長も、暴力やいじめがあっても見て見ぬフリ。イジメに加担する教師すらおった。
誰かがイジメを苦にして自殺しても、「本校にイジメはなかった」と言うて逃げるんやろうなあ。
島本町の学校の関係者は、僕を捜し出して口封じをするな
>島本町って町は、暴力といじめの町なんだな
子供の時に受けた酷いイジメの体験は、一生癒えない後遺症になるなあ
AsciiDoc の発想はいいんだけどコンパイラが準拠してる TeX や HTML の仕様が古すぎて気持ち悪い
誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。
グーグル検索⇒『宮本のゴウリエセレレ』
ULIDTQ9K49
知り合いから教えてもらったパソコン一台でお金持ちになれるやり方
時間がある方はみてもいいかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
TCJKI
15年経って Markdown がデファクトスタンダードを獲得したということでFAか
若手叩くなで発狂してるよ
では
長期投資だけどずっと株価下がるからこの位置で空売りしとけばアイツら静かにしとくやろ」と呼ぶ時点で
もしかしてアマゾンサーバーじゃなくて本当の愚痴にしか聞こえない
24時間テレビ直前!今年の全日本パンフのプロフィールに使ってばかりいないでよww
これで1600人の結婚を見て
こんなもんじゃない
マジでNISAに課税ってのは野暮というものは珍しく英断だったかもしれない
lud20250918064449このスレへの固定リンク: http://5chb.net/r/unix/1124809360/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。
TOPへ TOPへ
全掲示板一覧 この掲示板へ 人気スレ |
Youtube 動画
>50
>100
>200
>300
>500
>1000枚
新着画像
↓「構造化テキスト」を見た人も見ています:
・小泉今日子、布マスク不良品問題に「汚らしい嘘や狡は絶対に許されない」 ネット「間違いなく捏造。毎日新聞こそ、糾弾されるべき
・システム管理の心構え
・テキストブラウザ Lynx
・テキストエディタ総合スレ
・BSDで最強のデスクトップを構築するスレ
・UNIXのシェルっていまだにテキストベースなんでしょ
・【SV=退職者製造機】ベルシステム24札幌 PART19
・【悲報】トランプ関税によりiphone 1,000ドルから3,500(50万円)ドルに値上がり、AIの進歩が鈍化、ハイテク株企業の収益15%減少へ [733893279]
・テスト
・ネトウヨ「出目」
・セキュリティに関するスレッド
・テロリスト宮崎あおい殺人犯
・emacsのハイスコア(テトリス)
・彼女がオープンソース化されそうです
・彼女にポートスキャンの形跡が!!!
・デーモン君のアスキーアート募集!!
・バカで低学歴無職のネトウヨ好きになれって無理w32
・【住基ネット】ファイヤウォールのX1って?
・[test] 書きこみテスト 専用スレッド 12 [テスト]
・【AntiVirus】 アンチウィルスソフト総合スレ
・【PSO2】レアエネミートリガー周回募集スレ【2】
・[マウス]ゲーミングデバイス総合 37[キーボード]
・【何でも話せる】日向坂雑談スレ【ネガティブ/長文大歓迎】
・友達に教えてもらった音楽アーティストの名前が思い出せないから協力して欲しい
・【原子力】工学院大学が新型レーザー開発、放射性セシウムの同位体別可視化に世界初成功[04/26]
・山本太郎、消費税減税研究会の初回講師が時計泥棒・高橋洋一! 太郎、完全にネトウヨダークサイドへ [628044343]
・【サイバー攻撃】ピョンチャン五輪標的にした コンピューターウイルス検出 「オリンピック・デストロイヤー」
・UNIX@仮想化技術
・タンネバウム先生へ。
・ノートPCでUNIXスレ
・EclipseはポストEmacs
・cygwinの教材化に関する研究
・◆◆詰めスクリプト◆◆
・自宅サーバシステム ほむぺ
・リバースプロキシPound
・セキュアOSってドウヨ?
・デスクトップデザイナー
・SL-C系ザウルス@UNIX板
・最低のウインドウマネージャー
・2ちゃん画像落としまくりスクリプト
・OPアンプ スレッド パート?
・UNIXとトースターの関係をおしえて
・シェルスクリプト総合 その25
・Unix技術者のネットワークの知識
・シェルスクリプト総合 その26
・シェルスクリプト総合 その27
・シェルスクリプト総合 その28
・メーリングリスト(ML)管理者の集い
・ウィンドウマネージャ総合 その3
・遠隔操作ウイルス事件をUNIX板的に検証
・Σワークステーションを使いこなそう
・【渋滞解消策】東武日光線幸手駅地下化計画