昨日作成したRAID0+1の書き込み性能を測定しました。
やはり3台もつないでミラーリングするとかなり遅いです。
$ ./bench ./a 102400000 262144 loop: 391 time: 4.812052[sec] speed: 21.279903[MB/s]
速度の見積もりはUSBバス帯域を480Mbpsの7割とし、データがストライピングで完全に三等分になったとして、
336/3*2=224Mbps=28MB/sです。
見積もりと実測値がかなり離れているので他にオーバヘッドがあるのかもしれませんが、不正確を承知でもう2台追加した場合を計算すると、
336/5*3=201.6Mbps=25.2MB/sです。
このようにバスに余裕がない状態でミラーリングすると、ディスクを増やしただけ書き込み速度が下がります。
ちなみに RAID0のみならディスクを増やしても速度が落ちる心配はありません。バスの飽和まで速度が上がるはずです。まあ、あまり増やしても分散書き込みの処理のオーバヘッドが増えるだけですけどね…。
外付けUSB HDDでSoftware RAIDを構築する全ての方へ。
※私自身よくわかってないので、間違いなどあるかもしれません。ご指摘は大歓迎です。
LinuxではUSB Mass Storage(USB HDDやUSBフラッシュメモリ)をSCSIエミュレーションによりあたかもSCSIデバイス(sda, sdb, ...)であるかのように扱います。ところがどのSCSIデバイスに割り当てられるかが不明瞭で、ただ差し直しただけで対応が入れ替わったりします。/dev/sdaがどのデバイスと関連付けられるかは、やってみるまでわからず、これではとてもRAIDを構築できそうにありません。
USBデバイスを固定する(?)方法としてudevがあります。scsiバス上にある(エミュレーションなのでそう見える)「○○社」製のデバイスなら、usbhdaに割り当てる、などの設定が可能です。区別に使える情報はudevinfoというプログラムで得ることができます(udev使うなら /sys以下の情報(sysfs)が必要かも)。
# aptitude install udev # udevinfo -a -p /sys/block/hda (... 略 ...) follow the class device's "device" looking at the device chain at '/sys/devices/pci0000:00/0000:00:1f.1/ide0/0.0': BUS="ide" ID="0.0" DRIVER="ide-disk" SYSFS{drivename}="hda" SYSFS{media}="disk" SYSFS{modalias}="ide:m-disk"
たとえば ○○社製のhogehogeという名前のHDDが一台だけある、という環境でしたら、以下のように書くことができます。/etc/udev/rules.d/ 以下に .rulesで終わる名前のファイルを適当に作ります。例ではlocal.rulesとしています。
モデル名は大抵スペースが入っているので、udevinfoで確認することをお勧めします。
BUS="scsi", SYSFS{model}="hogehoge ", NAME="sda%n", SYMLINK="usbhda%n"
NAMEならデバイスファイルが、SYMLINKならデバイスファイルではなくシンボリックリンクが作られます。%kという文字列を指定すると、カーネルが作成したデバイス名(sdaとかですね)に置換されます。詳しくはudevのドキュメントを見てください。
ところがこれで解決しない場合があります。私のように同じメーカーの同じ製品を2台使っている場合です。USBの機器にはシリアル番号を提供するものもあり(私の所持するIO-DATA製の外付けディスクなどがそう)ますが、SCSIエミュレーションのデバイスが提供してくる情報からは得られず、全く区別がつきません。
そこでLinux 2.6で最近登場した ubを使います。カーネルをリコンパイルしてubを有効にします。そのさいusb-storageドライバとSCSIエミュレーションによる方法は勝手に無効化されます。たぶん…。
私の環境ではカーネル構築だけDebian流にやってません、ご容赦ください。
# cd /usr/src/linux # make menuconfig (Device Drivers -> Block devices -> Low Performance USB Block driver) (.configならCONFIG_BLK_DEV_UB = yにする)
再起動すると /devの下にubaとかubbというブロックデバイスができていると思います。このデバイスに対してudevinfoするとIDという項目があると思います。これはおそらくUSBバス上の物理的なポートの位置ではないかと思います。
# udevinfo -a -p /sys/block/uba (... 略 ...) follow the class device's "device" looking at the device chain at '/sys/devices/pci0000:00/0000:00:1d.7/usb1/1-1/1-1:1.0': BUS="usb" ID="1-1:1.0" DRIVER="ub" SYSFS{bAlternateSetting}=" 0" (... 略 ...)
差し替えたり、抜いてみたりして観察してみた限り、IDは私の環境では同じポートに接続する限り不変な値のようです。この性質を利用して区別します。
先ほどのlocal.rulesに対して、以下のように書きました。
BUS="usb", ID="1-1:1.0", NAME="usb1-1_hd%n" BUS="usb", ID="1-2:1.0", NAME="usb1-2_hd%n" BUS="usb", ID="1-3:1.0", NAME="usb1-3_hd%n" BUS="usb", ID="1-4:1.0", NAME="usb1-4_hd%n" BUS="usb", ID="1-5:1.0", NAME="usb1-5_hd%n" BUS="usb", ID="1-6:1.0", NAME="usb1-6_hd%n"
これでmount /dev/usb1-1_hd1 /mnt/usb1-1-1などとすると、ポート1に接続されているデバイスの先頭パーティションをマウントできます。
肝心のポート1がどれなのかは、実際に機器を接続してudevinfoをして調べます。私にはIDを調べるうまい方法がわかりませんでした。ごめんなさい。
外付けUSB HDDでSoftware RAIDを構築する全ての方へ。
※しつこいですが私自身よくわかってないので、間違いなどあるかもしれません。ご指摘は大歓迎です。
Software RAIDについては、先日(2006年5月7日参照)紹介したので mdadmの使い方、cat /proc/mdstatの意味など基本的なことはそちらを見ていただくとしましょう。
さて、当方の環境ですが /homeを担っていたhda7とUSB HDD 3台でRAID 0+1を構築し、/homeにマウントしようと思います。容量は160GB(RAID1)+160GB(RAID1) のストライピング(RAID0) で320GBとなります。信頼性と容量が今までの倍になるわけです。そのぶんHDDが4倍ですが…。
まずはRAID1を2つ作成します。RAID1をいきなり作ってしまうと、ディスクの同期処理が始まり何もできなくなるので、いったん縮退モードで作成してデータのコピーを済ませ、その後ディスクを追加します。
# mdadm --create /dev/md0 -l1 -n2 missing /dev/usb1-1_hd # mdadm --create /dev/md1 -l1 -n2 missing /dev/usb1-3_hd
次に2つのRAID1をまとめるRAID0アレイを作成します。この構成はRAID1+0と呼ぶのかもしれませんが、ここでは一貫してRAID0+1と呼びます。
RAIDを作成するときデバイスファイルがないと言われたら、-aを付けてください。
# mdadm --create /dev/md3 -a -l0 -n2 /dev/md0 /dev/md1
間違ってmd2ではなくmd3にしてしまいましたがそのままいきます…。/proc/mdstatを見て作成されたかどうか確認します。確認したらmd3をreiserfsでフォーマットします。
# cat /proc/mdstat Personalities : [linear] [raid0] [raid1] [raid5] [raid4] [raid6] md3 : active raid0 md0[0] md1[1] 317127104 blocks 64k chunks md1 : active raid1 ubc[1] 156290816 blocks [2/1] [_U] md0 : active raid1 uba[1] 160836416 blocks [2/1] [_U] unused devices: <none> # mkreiserfs /dev/md3 (... 略 ...)
ブート時に自動的に構成されるように /etc/mdadm/ にある mdadm.confにRAID構成の設定を保存します。
# cd /etc/mdadm # echo DEVICE /dev/usb* /dev/md* > mdadm.conf # mdadm --detail --scan >> mdadm.conf # cat mdadm.conf DEVICE /dev/usb1-1_hd /dev/usb1-2_hd /dev/usb1-3_hd /dev/md0 /dev/md1 /dev/md3 ARRAY /dev/md3 level=raid0 num-devices=2 UUID=bxxxxxxx:xxxxxxxx:xxxxxxxx:xxxxxxx2 devices=/dev/md0,/dev/md1 ARRAY /dev/md1 level=raid1 num-devices=2 UUID=0xxxxxxx:xxxxxxxx:xxxxxxxx:xxxxxxx9 devices=/dev/usb1-3_hd ARRAY /dev/md0 level=raid1 num-devices=2 UUID=9xxxxxxx:xxxxxxxx:xxxxxxxx:xxxxxxx7 devices=/dev/usb1-1_hd
catした結果を見るとmd3, md1, md0の順番でスキャンされています。このままで良いはずなのですが、私の環境では md3の設定を一番後ろに書かないと、起動時にコケてしまいます。md3がmd0とmd1に依存しているからかなあ?よくわかりません。
データをコピーして、再起動したらディスクを追加します。同期処理にしばらくかかるので放置しておきましょう。
# mdadm --manage /dev/md0 -a /dev/usb1-2_hd # mdadm --manage /dev/md1 -a /dev/hda7
mdadm.confの設定を更新するのもお忘れなく。あとはfstabを修正して再起動してみて、動作を確認したら終わりです。
大下さんとジョイ本へ買い物に行きました。教育実習に使う教材を作るためだそうで、製本テープや、画用紙だとかを買っていました。真面目にがんばってるなあ。
RAID5を構築する準備をしようと思い、USB接続のハードディスクを2台と、1つのバスに3台つなぐのはちょっと心細いから、USB 2.0のカードも買いました。
家に戻って「早速増設じゃー」とケースを開けたら、空きスロットが PCIバスじゃなくてAGPバスだった…。せっかく買ったのに使えないよorz
空きスロット=PCIバス?という思い込みで確認し忘れました。安い拡張カードだったのが命拾いですね。次回作サーバへの準備ということにしておきましょう。
中身はI/O製がHGSTの160GBでBuffalo製がWDの160GBでした。そんなことより、Buffaloの電源に台湾製のしょぼいコンデンサが刺さってます。HDDの近くで結構熱くなるし、まさか連続運用半年でアボーンなんて設計じゃないよね…?
榮樂氏の代わりとして臨時TAに行きました。Coinsはリプレースの影響で未だに超不安定らしいですよ。Macなんかにするから…なんてね。普段はたった一時間で2〜3台止まって当たり前だとか。今日は技官さんが今朝リブートしたからきっと大丈夫だよ、なんて言っていたおかげか特に問題ありませんでした。
自分は2学期にTAの予定ですが、はっきり言ってこんなシステム上でやりたくないぞ。
塚原氏と晩御飯食べに行きました。土浦の李厨房には学生割引がありますが、K'sの奥にある李厨房はどうだったろう?今度行った時に聞いてみようか。
走ると白煙が上がるらしい塚田氏の車、とうとう修理することにしたそうです。今日、塚田氏が修理屋さんに預けに行くというので榮樂氏とともについて行きました。代車はRAV4でした。毎回違う車が出てきてつくづく面白いお店だと思います。
乗ってみて感じたのは RAV4の加速がかなりイイ!ということです。我が家のFTOと同格の2000ccなのにこうも違うのは、以下の違いがあるからです。
これは馬力(仕事率)=トルク(力)×回転数(速度)という関係を考えるとわかりやすくなります。
式を見ると、高回転エンジンなら馬力が上がることがわかるかと思います。さらに同じトルクなら、低回転域で出すより高回転域で出した方がより最大馬力が稼げるわけです。
スポーツカーと呼ばれる車ならば、上記の最大馬力を稼ぐ設計をするはずです。
一方、街乗りに使う車はブン回すと燃費が悪い、うるさいなど悪影響が多いため高回転域は不要です。そのため低い回転数で良い「加速」を得る必要があります。そのための工夫点はエンジン設計者にしかわかりませんが、とにかく高回転域を犠牲にしてでも、低回転域でのトルクを稼ぐ設計にします。
セダン、ミニバン、SUVなど便利な車は、トルク重視の設計をするはずです。
これを逆転させてしまうと、初めだけ速いけど伸びが悪くて遅いスポーツカーや、思い切り回してナンボのモタモタセダンなどになってしまいます。これはきっと物好き以外には売れないでしょう。
ドコモの二次面接に向かいました。会場がなんとキャピトル東急という驚愕の高級ホテル。ホテルを目の前にして「これが二次面接の会場とはご立派だなあ」と感心しつつ控え室に居た人と話していたら……ハイ、ナニ、なんだって?
こ れ が 最 終 面 接 ?
おいいいいいい、そんなの聞いてねえよ!
思えば、人事の人「次の面接に進んでいただきたくご連絡を」としか言っていませんでした。それを早合点してじゃあもう一回あるんだと思ったのが悪かったです。うう、でも最終なら最終って言って欲しかったよ。
最終でもどんどん落とすと噂のドコモなのに、相当しどろもどろになってしまい、今日の面接は自分が面接官でも絶対落とすわーって思いましたね。向こうも呆れている感じでしたね。さよならドコモ。
近藤君と志村君が香辛飯屋の挑戦カレーに挑みましたが、残念ながら負けました。前見たやつと違って、野菜が入っているところがうっとおしいようです。
会計時に「割引券は一枚につき一品の値引き」と言われました。えぇ、そんなの知らないよ。チラシが一枚しかなくて本来なら2個目の挑戦カレーが値引きされないはずが、哀れに思ったのか店員さんが適当にごまかし安くしてくれました。
チラシはカラーコピーして構わないので、今度誰かやるなら頼む数だけチラシを揃えましょう。
車から加給音のような変な音がします。無論、ターボなんぞないので、エンジンのどこかが詰まって鳴っているのかもしれない。また壊れたのか…!
YouTubeのムービーURLを生成するスクリプトを書いてみました。
検索ワード(URLのword= 以降の所)を変えると検索結果も変わります。ただし、URLを生成するためにムービーを表示するページを一々読み込んでは解析して…と、やっているため結果が出るのが非常に遅いです。検索結果が多いと、数分かかるかも。イライラしてリロード連打しないでね。
時間が経つとユニークIDが失効して、ダウンロードできなくなります。そのときはリロードして新しいURLを生成してください。
ルートディレクトリのあるパーティションがクラッシュしました…。fsckするとlost+foundに全てのファイルがぶち込まれ復旧できず。これはどうしようもないってことで昨日一日使ってDebianを再インストールいたしましたよ。
Debianを触り始めた頃に付けていた必死設定メモが残っており非常に参考になりましたが、最近は面倒でメモっておらず、以前とかなり違う環境になりました。皆さん、メモは大事ですよ!
以前と変更したところというと、kinput2 + Cannaからuim + Anthyの組み合わせに変更した点と、起動がヘビーなGnome2 & metacityをやめて、IceWMだけにしたこと。VNCでしか利用しませんが、IceWMなら一瞬でvncserverが起動し終わります。ちょっと感動しました。
IceWMの設定をしているときにGTK周りのフォント設定もやったんですが、ややこしくて設定しきれませんでした。slypheed(GTK 1.0系 .gtkrcに設定)やgftp(GTK 2.0系 .gtkrc-2.0で設定)のフォントは変更できても、MozillaやFirefoxが言うことを聞きません。
原因がさっぱりなので、~/.mozilla/default/(7文字のランダム文字列).slt/chrome/userChrome.cssに(なければ作る)設定を書いてごまかしました。
* { font-family: alias-fixed-iso8859-1 !important; font-size: 12px !important; }
そういえば手持ちのWindows XPからコピーしてきたMSゴシックを使うのってOKなのだろうか。
きっと駄目なんだろうなー。
画面表示に使うことだけ考えるとビットマップフォントが多様に収録されているMSゴシックが優秀すぎるため、フリーのフォントは太刀打ちできません。
さらに言えば世の中に商用フォントは数あれど、画面表示用を重視したフォントは売られていないのですよ。OS標準のビットマップフォントで十分だし、フォント屋のお客さんであるDTPデザイナー達は画面表示用フォントなんて買わないからね。
現在ページのデザインを変更中です。おかしくなってる場所があるかもしれないです。日記の1日分を枠で囲うだけでblogっぽくなる気がしませんか?
トップページで日記の枠が右のメニューにめり込んでいるのは仕様です。
ソフトウェアRAID0を組み、簡単なベンチマークプログラムを走らせてみました。mkraidは古いのかDebianのパッケージになかったので代わりにmdadmを使いました。
# mdadm --create /dev/md0 -l0 -n2 /dev/sdb1 /dev/sda1 mdadm: /dev/sdb1 appears to contain an ext2fs file system size=277948352K mtime=Sun May 7 18:02:45 2006 mdadm: /dev/sdb1 appears to be part of a raid array: level=0 devices=2 ctime=Sun May 7 17:56:47 2006 mdadm: /dev/sda1 appears to be part of a raid array: level=0 devices=2 ctime=Sun May 7 17:56:47 2006 Continue creating array? y mdadm: array /dev/md0 started.
作成に成功すると /proc/mdstatに以下のような情報が追加されます。
# cat /proc/mdstat Personalities : [linear] [raid0] [raid1] [raid5] [raid4] md0 : active raid0 sda1[1] sdb1[0] 277948352 blocks 64k chunks unused devices: <none>
通常のパーティションと同様にファイルシステムを作成します。この例ではext3ですが、好みのファイルシステムがあればそれを使ってください。
# mke2fs /dev/md0 (省略) # tune2fs -c0 -i0 -j /dev/md0 (省略) # mount /dev/md0 /mnt/usb_raid
1バイトずつストライピングしていては遅いばかりで性能が上がらないので、chunkという値に指定したサイズを単位としてストライピングされます。今回はchunkをいじっていないのでデフォルトの64KBになっているはずです。
そして今回用いた簡易ベンチマークはDirect I/Oを用いてファイルにランダム値を書き込みます。このとき一度にwriteで書き込む量を変化させてベンチマークを行いました。おそらく chunkの整数倍の方が性能が上がると予想しますが、さてどうなるでしょうか。
buffer[KB] speed[MB/s] 32 23.569085 64 29.780680 96 33.003887 128 37.963501 160 36.080456 192 35.805102 224 36.681815 256 37.470814
結果を見ると128KB以上のバッファサイズであれば大した差はないようです。さすがにこの程度は考慮済みなのでしょう。
RAID0の速度は、昨日(5/6)hdparmで同時に測った値(sda=21.5[MB/s] sdb=17.0[MB/s])の和とほぼ等しいです。つまりhdparmの誤差で遅く見えたのではなく、USBは同時アクセスが苦手だと考えられます。
ちなみにディスクアレイを停止させる場合は、以下のようにします。
# cat /proc/mdstat Personalities : [linear] [raid0] [raid1] [raid5] [raid4] md0 : active raid0 sda1[1] sdb1[0] 277948352 blocks 64k chunks unused devices: <none> # mdadm --misc -S /dev/md0 # cat /proc/mdstat Personalities : [linear] [raid0] [raid1] [raid5] [raid4] unused devices: <none>
確認のために /proc/mdstatの出力をさせました。md0が消滅していることがわかると思います。
久しぶりに作業に参加しました。久しぶりに日の光に当たったから疲れました…。
帰りに研究室によってUSBから電源供給するケーブルを持ってきましたので、先日(2006年5月3日)動かなかったポータブルHDDの動作を確認できました。これでUSBに二つのディスクが接続された環境が得られました。早速実験です。
さてRAIDを組むに当たって、二つ同時にアクセスが発生することが考えられます。そこで USB接続のディスクに対する同時アクセスは速度面で得なのか?を確かめました。まず単独で各デバイスの速度を計測します。UATA100接続のディスクhda1を比較対象として載せました。
# hdparm -t /dev/hda1 /dev/hda1: Timing buffered disk reads: 186 MB in 3.02 seconds = 61.51 MB/sec # hdparm -t /dev/sda1 /dev/sda1: Timing buffered disk reads: 92 MB in 3.01 seconds = 30.59 MB/sec # hdparm -t /dev/sdb1 /dev/sdb1: Timing buffered disk reads: 70 MB in 3.00 seconds = 23.32 MB/sec
二つのディスクのアクセス速度を加算しても、バスの帯域上限(480Mbps = 60MB/s)に達しないので、遅くならないだろうと思ったら意外にも10MB/s以上遅い結果が得られました。
# hdparm -t /dev/sda1 /dev/sda1: Timing buffered disk reads: 66 MB in 3.07 seconds = 21.47 MB/sec # hdparm -t /dev/sdb1 /dev/sdb1: Timing buffered disk reads: 52 MB in 3.04 seconds = 17.08 MB/sec
原因としてUSBというのはそもそも、同時に複数デバイスを読みに行くパターンを苦手とするのか、それとも単にhdparmの結果が不正確なだけなのか、のどちらかが考えられます。hdparmの影響を確かめるにはDirect I/Oでファイルを書き出す程度の簡単なベンチマークプログラムを書いてみればわかるのかな?
ソフトウェアRAIDが速度にどの程度影響するのかも気になるため、ストライピング構成を使ってより実環境に近い値を測ろうと思います。まあこの程度の構成ならば影響ないと信じたい…。
大下さんと晩御飯を食べにさとまで自転車で行きました。軽いサイクリング代わりになりました。
大下さんの自転車が壊れかけでボロボロなのが気になって仕方ないです。折りたたみ自転車やアルミフレームの軽い自転車なんかも、安くて良いものが売ってるんだから、無理して修理しながら乗らないで買い換えれば良いのにねー。
USB接続の外付けHDDを買ってきました。IO-DATA製です。ちなみにソフトウェアRAIDに挑戦してみたいので、しばらく使ってみて問題なさそうならもう一台購入する予定です。
早速分解してみると、中身はHGST(日立IBM)のDeskstarでした。最近はSeagateが好きですが、別にどの会社が駄目って事はありません。あ、でもサムスンのHDDだったらちょっと入れ替えを検討したくなるかも…。
ちなみにこのドライブは HDD以外はきっと同じ部品の使いまわしで、HDDだけ簡単に入れ替えられるのではないかと予想しております。
hdparm -tで測ってみると、USB HDDは26.8MB/sとちょっと遅いです。同じマシンで使っているUATA100のディスクは60MB/s出ていました。USBが遅いのは前々から予想していたので仕方ないかな。
たぶん風邪直りました。まだ若干ですが喉が痛いです。
4/29に書いたバックアップをやろうと思って、研究室からUSB接続のポータブルHDDを拝借して動作確認をしました。ところが全く動きません。さらにHDDからカチッカチッと音がしています。
壊したか?…と思ったら実は電力不足でした。2.5インチHDD(ポータブルHDDの中身ね)を駆動するには USBのバスパワーではギリギリらしく、この手の製品は「環境によって動かない」ことが多々あります。我が家のマシンのようにバスパワーの出力が足りないと、アクセスランプだけ点くとか半端な動作をしてしまうわけですね。
ちなみにお気づきの方も居られるでしょうが、バックアップ用途にポータブルHDDは使いません。通常は3.5インチHDD(電源を別に取るタイプ)を使います。「バスパワー関係無いじゃん?」という指摘はごもっともです。
田口邸の飲み会に行きました。じょーや徳若氏と久しぶりに会った気がします。いつのまにか徳若氏はS15シルビアに乗り換えていました。徳若氏は燃費が悪くなったよってぼやいてましたが、そりゃヴィヴィオビストロ(軽自動車)と比べたらどんな車でも駄目だろう。じょーは警察学校が楽しそうでもあり、しんどそうな感じでもありました。
たぶん風邪ひいたのだと思いますが、起き上がると非常にだるいので、一日中寝ていました。
< | 2006 | > | ||||
<< | < | 05 | > | >> | ||
日 | 月 | 火 | 水 | 木 | 金 | 土 |
- | 1 | 2 | 3 | 4 | 5 | 6 |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 | - | - | - |
合計:
本日: