みなさん librahack 事件をご存知ですか? この業界ではかなり騒がれたので知っている方が多いと思います。もし知らなければ下記まとめ site を見てください。
岡崎市立中央図書館事件 議論と検証のまとめ
Librahack 事件でたまに問題に上るのが図書館は robots.txt で crawler を禁止していたが、これに access するのは違法ではないかという点です。
これに関しては 2010 年 1 月より改正法令 (著作権法施行規則の一部を改正する省令 (平成21年省令第38号)の概要) が施行されています。
著作権法 第四十七条の六
第四十七条の六 公衆からの求めに応じ、送信可能化された情報に係る送信元識別符号(自動公衆送信の送信元を識別するための文字、番号、記号その他の符号をいう。以下この条において同じ。)を検索し、及びその結果を提供することを業として行う者(当該事業の一部を行う者を含み、送信可能化された情報の収集、整理及び提供を政令で定める基準に従つて行う者に限る。)は、当該検索及びその結果の提供を行うために必要と認められる限度において、送信可能化された著作物(当該著作物に係る自動公衆送信について受信者を識別するための情報の入力を求めることその他の受信を制限するための手段が講じられている場合にあつては、当該自動公衆送信の受信について当該手段を講じた者の承諾を得たものに限る。)について、記録媒体への記録又は翻案(これにより創作した二次的著作物の記録を含む。)を行い、及び公衆からの求めに応じ、当該求めに関する送信可能化された情報に係る送信元識別符号の提供と併せて、当該記録媒体に記録された当該著作物の複製物(当該著作物に係る当該二次的著作物の複製物を含む。以下この条において「検索結果提供用記録」という。)のうち当該送信元識別符号に係るものを用いて自動公衆送信(送信可能化を含む。)を行うことができる。ただし、当該検索結果提供用記録に係る著作物に係る送信可能化が著作権を侵害するものであること(国外で行われた送信可能化にあつては、国内で行われたとしたならば著作権の侵害となるべきものであること)を知つたときは、その後は、当該検索結果提供用記録を用いた自動公衆送信(送信可能化を含む。)を行つてはならない。
著作権法施行令 第七条の五
第七条の五 法第四十七条の六 (法第百二条第一項 において準用する場合を含む。第二号において同じ。)の政令で定める基準は、次のとおりとする。
一 送信可能化された情報の収集、整理及び提供をプログラムにより自動的に行うこと。
二 文部科学省令で定める方法に従い法第四十七条の六 に規定する者による収集を禁止する措置がとられた情報の収集を行わないこと。
三 送信可能化された情報を収集しようとする場合において、既に収集した情報について前号に規定する措置がとられているときは、当該情報の記録を消去すること。
著作権法施行規則 第四条の四
第四条の四 令第七条の五第二号 の文部科学省令で定める方法は、次に掲げる行為のいずれかを、法第四十七条の六(法第百二条第一項において準用する場合を含む。以下この条において同じ。)に規定する者による情報の収集を禁止する措置に係る一般の慣行に従つて行う方法とする。
一 robots.txtの名称の付された電磁的記録(法第三十一条第二項に規定する電磁的記録をいう。次号において同じ。)で送信可能化されたものに次に掲げる事項を記載すること。
イ 法第四十七条の六に規定する者による情報の収集のためのプログラムのうち情報の収集を禁止するもの
ロ 法第四十七条の六に規定する者による収集を禁止する情報の範囲
二 HTML(送信可能化された情報を電子計算機による閲覧の用に供するに当たり、当該情報の表示の配列その他の態様を示すとともに、当該情報以外の情報で送信可能化されたものの送信の求めを簡易に行えるようにするための電磁的記録を作成するために用いられる文字その他の記号及びその体系であつて、国際的な標準となつているものをいう。)その他これに類するもので作成された電磁的記録で送信可能化されたものに法第四十七条の六に規定する者による情報の収集を禁止する旨を記載すること。
「著作権法 第四十七条の六」により著作物を複製する権利が認められています。ただし、明示的に禁止しているものについては「著作権法施行令 第七条の五 第二号」によって情報の収集を行わないことが求められます。その具体的な基準として「著作権法施行規則 第四条の四 第一号」に robots.txt が明示されています。なお、「著作権法施行規則 第四条の四 第二号」により meta tag 等 robots.txt 以外のもの利用して禁止した場合もこの法令に当てはまります。
「著作権法施行規則 第四条の四」にはこちらの制限を受ける対象者として「著作権法 第四十七条の六」で規定する者とあり、これは収集した情報を公開する者が対象になります。また、「著作権法施行規則 第四条の四」で情報の収集を禁止する対象は、著作物ではなく電磁的記録となっているため著作物でなくてもこの制限を受けることにご注意ください。
なんか難しいこと書いてあるように見えますが、単純です。収集した情報を公開する場合には、robots.txt や meta tag によって禁止している情報は収集しちゃいけませんよということです。
なお、収集した情報を公開しない場合の規定はありませんので、これら法令の引用部分では制限されません。著作物であれば著作権法および関連法令の他の部分による制限を受けます。
収集した情報を公開する場合には robots.txt および meta tag 等を確認し、その求める動作に従うことが法令により求められています。ここを見ている方で crawler を作成している人は多いと思いますが、robots.txt 等の制限は日本の法律で制限されていますので、情報を公開するのであれば必ず求める動作に従うようにしましょう。
上記に関して指摘 (Robots.txt に関する法令解釈) を受けました。
「著作権法 第四十七条の六」は収集した情報を公開するものに対して著作物を複製する権利を有することが主旨であるため、「著作権法施行令 第七条の五」、「著作権法施行規則 第四条の四」に違反した場合には「著作権法 第四十七条の六」で認められる権利が失効するという法解釈です。すなわち対象が著作物であれば著作権法の他の条項に従って判断され、著作物でなければ他の法令によって制限されていない限り認められるということになります。
例えば、「著作権法 第六十三条」によって著作権者の許諾があれば著作物をその許諾範囲で著作物を利用することができるため、この場合は robots.txt を無視しても問題ないことになります。これはそのとおりでしょう。
Robots.txt 無視して収集した情報を公開することがすべて違法になるわけではありませんが、著作物である場合には違法となりえる可能性が高いです。そのため、公開目的で crawling する場合には robots.txt や (meta tag 等) を判定して禁止されている場合には crawling しない、または著作権者の許諾を求めるといった対応が必要になるでしょう。