Googleスプレッドシートでスクレイピング(json生成)

スプレッドシートには超便利な、データ収集機能がついてます。
意外と知ってる人いないけど便利すぎてたまげる。

ImportHtml

=ImportHtml("http://www.data.jma.go.jp/obd/stats/etrn/view/nml_sfc_ym.php?prec_no=44&block_no=47662&year=2019&month=12&day=&view=", "table", "0")

URLは 取得したいデータのあるページ
クエリはテーブル
指数はなんばんめにあるか。

って感じですね。クエリで指定できるのはlistかtableのみ。

=ImportHtml("http://www.data.jma.go.jp/obd/stats/etrn/view/nml_sfc_ym.php?prec_no=44&block_no=47662&year=2019&month=12&day=&view=", "table", "0")

天気に関するページからデータを取ってきてます。

IMPORTXML


//タイトル
=IMPORTXML("https://www.yahoo.co.jp/","//title")

//ディスクリプション
=IMPORTXML("https://www.yahoo.co.jp/","//meta[@name='description']/@content")

=IMPORTXML("https://www.yahoo.co.jp/","//a/@href")
=IMPORTXML("https://www.yahoo.co.jp/","//a/text()")

最初にURL
次の引数はXpathです。

デベロッパーツールでxpathを入手できるのですが
なかなかうまく出力できません。
//titleとかいれると、ページのタイトルが出てきます。

上の例はリンク先一覧が出てきます。

Xpathについて記事があったので貼っておきます
https://qiita.com/rllllho/items/cb1187cec0fb17fc650a

うーむ、やってもうまくいかない・・・

とってきたデータでjsonをつくると面白いかもしれません。

サイトに出力利用する方法は以下