生命情報表現論講義メモ
- National Center for Biotechnology Information
- http://www.ebi.ac.uk/embl/
- Bioinformation and DDBJ Center
- GenBankに配列を登録しないと論文がAcceptされない。登録を促すようなルール -> データの増加。
1.
2.ゲノムデータベースの特徴
- データの解釈の変化 例:geneの意味
- 生データのほかに解釈が必要
- 前処理が必要
- 追加が頻繁に起こる
- モデル化が困難(データの意味が不明) ・どういったクエリが必要か分からずインデックスの作成が困難
- 高度な問い合わせ(類似性を基にした問い合わせなど)
3.データベースの検索
類似性に基づく検索
- ホモロジー検索 BLAST: Basic Local Alignment Search Tool
- 立体構造、モチーフ、発現、形態、機能・・・
- データが大量で人の目では不可能
4.90年代前半
- DBsはばらばらに管理運営
- エントリが文献単位
- 精度の違うデータの混在
- 統合化・再編成・精錬が課題
5.統合化へのアプローチ
- 強い統合化 <- 先進データベース技術, 演繹
- 弱い統合化 <- リンクによるデータの統合(主流になってきている)
- 共通フォーマット <- データ記述言語
6.2000年代以降
- ハイスループットな実験手法の進展
- 解釈できない膨大なオーミクスデータ
- 機能データベースの構築と統合化
- システム生物学の勃興
機能データベースのための知識の記述法
知識表現
- プロダクションシステム - Wikipedia
- 述語論理
- フレーム・スクリプト
- オブジェクト
- 意味ネットワーク
- 手続き
- セマンティック・ウェブ - Wikipedia