図書館司書の職人芸的な話。Indexを人手で作成する。分かち書きや読みの転写などの複雑なルールを策定し、教育を通じて全国の図書館で統一的に実施していた。改めて聞くとすごい世界 #SolrJP
2015-05-13 19:44:32大向さんの議論は図書館文化と検索技術と題して、言語処理の歴史と図書館目録の世界の話をつなげるところから始まっていてすごく新鮮である。 #solrjp
2015-05-13 19:48:16国立情報学研究所のサービスで、CiNiiを提供してます。学生はこれか、Google Scholarを使うのは常識。#SolrJP
2015-05-13 19:51:43CiNii Dissertationsは初めて見た。まもなくリリース予定。検索エンジンはElasticSearchらしい。 #solrjp
2015-05-13 19:54:02CiNii ArticlesはSolr + 某社パッケージ。CiNii BooksはSolr。CiNii Dissertations(開発中)はelasticsearch。外見は統一しているが、内部的にはそれぞれ検索エンジンの構成が違う #SolrJP
2015-05-13 19:54:29CiNii Dissertations(開発中)は博士論文検索用。昨年の論文ねつ造事件以降博士論文検索は需要が高いとのこと #SolrJP
2015-05-13 19:55:20CiNiiは、Articles は PostgreSQL、Books は MySQL、Dissertactions は Elasticsearchです。#SolrJP
2015-05-13 19:55:47Booksでは、言語が不明だったりするので、トークナイザーをかなり頑張った。1100万書誌、160万著者。お役所はヒットしても予算が増えないのが辛い。#SolrJP
2015-05-13 19:59:37KAKEN/SEIKA、科研費の細目が毎年変わる。学問の発展とともに変化するのは必然だが、検索可能性を維持しつつ対応していくのが大変。新バージョンはRiak+Solrで開発中。 #SolrJP
2015-05-13 20:03:09