にしもと.blog

色々してます。

SILVAのsilva_taxons.bacteria.tsv からOTUにアサインされている種名を集計する

クソクソマイナー記事 ◯◯って属にどのような種が含まれているか?をSILVAの silva_taxons.bacteria.tsvから集計する

genus_name=""
grep $genus_name silva_taxons.bacteria.tsv | cut -f 8 | cut -d "|" -f 7 | grep -v "uncultured" | grep -v "sp." | grep -v "unidentified" | grep -v "gut" | cut -d "_" -f 1,2 | sort | uniq -c | sort -r

KaggleのAPIに関するメモ(ダウンロードとサブミットのコマンド)

なかなか覚えられない。自分用のメモ。

データのsubmit

kaggle competitions submit -c home-credit-default-risk -f submit.csv -m "any comment"

competitionの名前(-cオプションの値)は MySubmissionから確認することができる。
Submit Predictionsには情報が乗っていないため注意すること。

データのdownload

kaggle competitions download -c home-credit-default-risk -w 

このコマンドは"Data"のページから確認することができる。
なお、-wをつけることで現在のディレクトリに対してダウンロードすることができる。
参考: kaggle-api kaggleコマンドの使い方

mediawikiのサーバー移管(バックアップからの復旧)のやり方とエラーに対する対応

サーバー移管のやり方

基本的には公式のやり方を参照すればできます。

https://www.mediawiki.org/wiki/Manual:Restoring_a_wiki_from_backup

大まかな流れとしては

  • ローカルでLocalSettings.php、backup.sqlの編集
  • ファイルをアップロード
  • phpMyAdmin経由でDBのインポート

の3点で対応できます。

以下、1つ目の「LocalSettings.php、backup.sqlの編集」について述べます。

sqlファイルの中身を書き換え

  • USE 使用DB名; を頭に挿入した
  • ドメイン名を直接置換した
    ... externallinksテーブルの中身が旧ドメインとなっていたため置換しました。。が、
    必要かどうかはわからない

LocalSettings.phpの中身を書き換え

  • $wgServer の中身(ドメイン名)
  • DB周りの変数
    • $wgDBserver
    • $wgDBname
    • $wgDBuser
    • $wgDBpassword
    • $wgDBTableOptions(binary => utf8 にした)
  • $wgReadOnlyコメントアウト

Macのエクセルでシート名一覧を取得する

Windowsとほぼ同じでした。

①:エクセルを開いて、Alt+F11でVisual Basic Editorを開く

②:右下に文字入力できる白い画面があるはずなので以下を入力 (なかったら、◯を押してグリグリすることで出て来るはず)

For Each i In ThisWorkbook.Sheets: debug.print i.name : next I

上にある■▲ ← こんな感じの実行ボタンを押す

以上

pd.DataFrameをdictから生成する

メモです

import pandas as pd 
from collection import defaultdict
# 実際こっちつかう
dd = defaultdict(lambda : defaultdict(int))

dic = {
    "A": {
        "R1": 1,
        "R2": 2,
        "R3": 3
    }, 
    "B": {
        "R1": 2,
        "R2": 3,
        "R3": 4
    }
}

pd.DataFrame(dic)

f:id:no-ku-ma:20171214120501p:plain