sunasunablog

sunasunablog

パソコン初心者のお話

よく見るデータのフォーマットについて調べてみた。

プログラミングの参考書を読んでいたら色んなフォーマットが出てきたけど、知らないものも多かったからまとめてみた。

拡張子なら分かる?

wikiから引用すると、

ファイルの種類を識別するためにファイルの名前と末尾につけられる文字列。

とある。シンプルで分かりやすく、端的に説明できていると思う。

あるフォーマットに沿って書かれた文書には対応した拡張子を与えないといけない。

普段からパソコンに触れる機会が多いビジネスマンやエンジニアにはこの程度の説明で十分だろう。よし、次。

様々なフォーマット

今回、この記事を書く経緯となったその参考書にあったフォーマットを調べてみた。

では早速内容に入ろう。

XML

XMLはExtensible Markup Languageの略である。訳すと「拡張性のあるマークアップ言語」となる。1998年にW3Cが勧告したオープンな規格である。どうやらマークアップ言語はHTML以外にXMLや他にもたくさんあるらしい。知らなかった、、、。 XMLはHTMLと同様にマークアップ言語なので、内容をタグで囲ってその内容に対して、「これはこういう意味だよ」と意味付けることができる。しかもHTMLと異なり、そのタグを自分で好きな様に決定することができる。

<member>
    <people>
        <name>まこっちゃん</name>
        <age>23</age>
        <gender>male</gender>
    </people>
    <people>
        <name>りな</name>
        <age>23</age>
        <gender>female</gender>
    </people>
</member>

HTMLとの違い

軽く調べた感じ、1番の差はそれぞれの用途にある。HTMLは皆さんご存知の通り、Webサイトを制作するときに用いられる言語である。 XMLはデータ記述用の言語であるため、その情報にタグによって意味を持たせたデータの集まりとして扱うことができる。しかもW3Cによるオープンな規格であるから、あらゆるマシン(?)に対応していて、なおさらデータのやりとりにはうってつけってわけ。

JSON

データ記述言語の1つで、JavaScript Object Notationの略。直訳すると「JavaScriptのオブジェクトの表記法」となる。直訳過ぎて申し訳ない。

JSONとはデータを記述する際に用いられる記法で、名前に含まれている「JavaScript」は書き方の基となったというだけで、他のあらゆる言語でもサポートされていている。

json形式のデータはコンピュータが読みやすいだけでなく、我々人間も見て直感的に把握できる様な書き方になっている(勿論そのデータによるが)。

"member": {
    {
        "name": "まこっちゃん",
        "age": 23,
        "gender": "male"
    },
    {
        "name: "りな",
        "age": 23,
        "gender": "female"
    }

CSV

Comma Separated Valueの略。直訳すると「カンマ(,)で区切られた値」になる。データをカンマで区切って表記する。

ごりごりのエンジニアリングでは用いられる機会は少ない様に思うが、恐らくパソコンでデータを管理する一般のビジネスマンには割と馴染み深い言葉なのではないかと予想する。

名前,性別,年齢
まこっちゃん,23,male
りな,23,female

一見すると素っ気ない表記で内容が分かりづらいが、その分メリットもある。ご覧の通り、最低限の書き方しかしてないから、ファイルサイズが小さくできて、他のアプリケーションにも適用しやすい。

おしまい

この記事を書くきっかけになった参考書にはもっと色んなフォーマットが書いてあったが、よく見るXMLJSONCSVをピックアップしてみた。

パソコン初心者の勉強に少しでもなれば幸いである。ばいばい。