ラッ疎回帰のCVがガチャなので禁を犯してcv.foldsを書き換える記事

R

最近ビッグデータ占い師の研究をしており、関数型言語Rと格闘しています。LASSO回帰という便利な回帰があります。 Ridge回帰との主な違いとして、Ridgeは名詞、LASSOは略語*1です。 高次元空間ではL1-normが1となる点の集合が成す多面体の角っこがトゲトゲす…

install: missing destination file operand after `mypackage'

R

$ R CMD install mypackage install: missing destination file operand after `mypackage'と言われる問題。install -> INSTALL と置換すれば良いらしい。 uninstallする際も、 R CMD remove mypackageではなく、 R CMD REMOVE mypackageとする。

YamChaとかMeCabとか使って顔文字抽出

NLP

概要 Ruby,YamCha,MeCabで顔文字抽出を作りました。前に情報特別演習(筑波大学の実践的な授業)でやっていたものより精度が良かったので、こっちを先に公開します。先に言っておくと、残念ながら私のオリジナルではありません。

TRIE木全体を1つの論理式で表す

あらすじ reTRIEval treeの名の通り、恐るべき検索効率を誇るTRIE木。これをPrologで実装しようとした所、最終的には「単語集合を1つの節に変換するRubyのスクリプト」ができあがったので、記録として書いておきます。なお、この記事はTRIE木もRubyもProlog…

Prologで4ナイト入れ替え問題を実装

4 Knights Problem? 4 Knights Problemという問題があります。「ナイト 入れ替え チェス」などとググれば、簡単にヒットしますが、簡単に説明すると、3x3のマスの四隅に白・黒のチェスのナイトが2つずつ置かれていて、それを動かして、白と黒の位置を交換す…

パンくずリストを生成するJavaScript

はじめに とても常識的なプログラムを書きました。パンくずリストを生成するJavaScriptです。 ファイルごとの名前をハッシュ形式で指定し、実行時に読み込んで生成しています。例えば、下記の定義において、www.haroperi.info/emoticonは、はろぺり研>顔文…

顔文字をMeCabで形態素解析する

NLP

顔文字を形態素解析? テキストコミュニケーションにおける「身振り手振り言語」とも言われる顔文字は、目・鼻・口などの顔のパーツから構成されています。ところで顔文字をパーツごとに分割し、パーツの種類(品詞)を推定するというタスクは、形態素解析と…

曲線に曲げる折り紙

概要 球形の折り紙を作る研究をしている筑波大学の三谷先生という方がいる。 実はそんなに興味はないんだけど、オムニバス形式の講義で先生の話を聞く機会があり、かつ折り紙は好きなので。

双方向性のある階乗

はじめに 双方向性のあるプログラムを書くのはなかなか難しい。階乗を計算する双方向性のあるプログラムをPrologで書いたので、公開する。

Rubyで自分自身のSTDERRを読む

What's this? Reading own STDERR in Ruby

Macでコンピュータに日本語を喋らせるための何か

Waht's this? 標準入力から受け取った日本語テキストを読み上げる Requirements MeCab SayKana Source code #!/usr/bin/ruby mouth = open("|mecab -O yomi|SayKana >/dev/null", 'w') while l = gets l.chomp! mouth.puts l if l && l != '' end Latest ver…

PostScriptでタイミングチャートを描くためのRubyを書いた

はじめに 筑波大学情報学群情報科学類では、2年次の必修科目として論理回路実験と呼ばれる1.5単位がある。これは2週間に一度、実験レポートを書かされるもので、「実験の手順の説明→実験結果→考察」というような流れの実験レポートを書く機会があまりない情…

熱海の宿で涙目になりながらMac OS Xを再インストールし続けた話

情報科学若手の会という集まりがある。下は学部生から上は2^5歳くらいまでの30人余の若手が集まり、宿に引きこもって、朝から翌日朝まで討論を続ける非常に濃いイベントだ。9月17日―19日に熱海で行われた第42回の同会に参加したので、感想をちょこちょこっと…

Rubyで半角カタカナを全角カタカナに、全角英数字を半角英数字に変換する

はじめに 相変わらずNLPというよりは文字列処理ですね。内部的にnkfを呼び出します。OSはMac OS X 10.6.7、バージョンは1.9.2, 1.8.7にて確認しました。

Mozc r56 手書き入力を試す

Google日本語入力のオープンソース版であるMozcが、つい昨日アップデートされました。手書き入力のツールが追加されたことと、いくつかのバグフィックスが主な更新のようです。手書き入力を中心に、軽く紹介します。手書き入力に関して詳しくないので、性能…

論理的な思考能力が発現し、Prologに関心を抱くお年頃

前々から私は「NLPが好きだ、NLPと結婚したい、いや、むしろNLPになりたい!」みたいなことを言っていました。そしてPrologという言語は、NLPを行うために作られた言語らしいです。しかし私にとってPrologとNLPは、今のところ関係ありません。と言いますのも…

集合論の英単語の一覧のまとめ

集合論の用語の一覧です。別には私は専門家じゃないけど。 出典は以下のURLから。 ただし手作業で抽出したので、その段階で様々な誤り、勘違いが含まれている可能性があることをご承知おきください。 また、文脈によって英語での呼び方が変わることもありま…

Rubyで日本語を含むURLを扱う

メモっぽい記事を書くのはあまり好きではないのですが、せっかく調べたので書きます。 Ruby1.9に移行したらどうなるのかはわかりませんけど、日本語の処理に多少の不安を残すRuby1.8にとって、日本語を含むURL、例えばwikipediaなどは扱いにくいです。 Ruby…

内部的にGitでバージョン管理を行うCMSを作ってる

HTML5対応を目指している新しいCMSです。はてな記法で記述します。もともとSQLiteを使っていたのですが、内部的にGitを使えばバージョン管理が楽そうなので、やってみているところです。 git diff, bralme, revertなど、Gitの強力な機能を利用していく予定で…

回文になっている単語の一覧

概要 辞書を引いて、手作業で一生懸命調べました。嘘です。MeCabが使っている、IPAdicを元にした辞書を使って、ちょこちょこっと作りました。 読んでいても面白くないですが、逆から読んでも同じ単語の一覧という資料としての価値があると思ったので。 文字…

Google日本語入力で素因数分解をする

Mozcとはなんぞ Mozc とは Google 社が開発した日本語入力のオープンソース版の名称です。リリース版はGoogle日本語入力として公開されています。Google 社の工藤拓氏、小松弘幸氏の 20%プロジェクトか ら始まって正式プロジェクトに昇格し、昨年末にはとう…

Reduction Meta Operatorの例

Perl6における標準的な魔法のお話です。Perl5とPerl6には互換性がないので注意してください。 Reduction Meta Operatorはメタオペレータ、つまり演算子に作用する演算子です。結果としてはLispに近いものを感じますが、ちょっと違う気もします。またこの場合…

Ubuntuをインストール後の作業をひとまとめにした

VMだったり実機だったり、とにかくUbuntuをインストールする機会が多くなったので、ひとまとめにした。 もっといい方法があったら教えて欲しいです。

C++0x Macにて。

概要 MacPorts無しでGCC4.6入れた。無駄に頑張ったけど、最終的には簡単だった。そのまとめ。私の環境は64bitモードだったけど、他の人のMacで試したときは32bitモードだったので、そこらへんはあまり関係ないみたい。 ところで、gcc-4.6, gcc-46, gcc4.6, g…

TinyCのインタプリタを作りかけた

概要 TinyCというCのサブセットのインタプリタを作ったので公開します。 とっても未完成で、しかもたくさんバグがあるのであまり意味はないんだけど、 lexとyaccをC++で使ったので、参考になればいいなあと思います。 講義の課題として提出したものです。ど…

Rubyはじめました

概要 MacマシンにRubyを入れました。 C/C++じゃGUIが書けないんですよ!*1ということでRubyを始めた。 でも、GUIアプリを書いたんじゃなくて、Rubyからグラフィカルなアプリを呼び出すだけ。 *1:面倒くさそうだから嫌だ

PKU Judge Onlineニ参戦ス

POJとは POJはPKU Judge Onlineの略。 過去にあった様々なプログラミングコンテストの問題を収集し掲載しているサイト。 その問題を解き、ソースコードを送信すると、向こうでコンパイル・実行してくれて、正しく動作したかどうかを確認する事ができる。*1 *…

gcc-4.6入れた

Mac

macportsからインストールできるようになったらしい。 インストール方法は以下の通り。 sudo port selfupdate sudo port install gcc46使い方は以下の通り。 gcc-mp-4.6 g++-mp-4.6C++0xもやりたいなあ。

銀河変換というものを作ってます

概要 銀河変換とは、日本語の文章を銀河日本語に変換する作業のことです。 自然言語処理を勉強しようと思ってMeCabで遊んでいたら、脇道にそれまして、その産物がこれです。 以下の詳しくは実行例を見てください。 PerlとMeCabを使っています。 文字列処理と…

Macの再インストール後にやったこと

Mac

概要 最終更新=2011/09/20 多くの人が公開しているような内容ですが、今後のためにやった事をメモしておきます。 個人的なメモでもありますが、他の人も参考に出来る箇所はあるはずなので。 当たり前のことから、個人的な細かい設定まで。