KNPの固有表現認識モデル学習方法

KNPでも学習データを用意すれば、CaboChaのように固有表現認識モデルを学習させることができる。 学習方法は、ここに書かれている通りだけど、試してみてセグフォに嵌ったのでメモ_φ(・_・ JUMAN 7.01 KNP 4.16 学習データの用意(アノテーション) 学習データ…

ValueError: numpy.dtype has the wrong size, try recompiling

scikit-learnとかpandas環境のセットアップ作業で、手間取ってnumpyのバージョン動かしてると出るエラー。 単純に再インストールしてもキャッシュを見てビルドされないらしー。 $ pip uninstall scikit-learn $ pip install scikit-learn==0.16.1 --no-cache…

係り受け解析器の学習機能

もう少し自然言語処理の意味理解よりのことをちゃんと勉強してみようと思う今日この頃。のやったことメモ_φ(・_・ 今回は、係り受け解析器のうち、CaboChaとJ.DepP の学習機能を動かしてみたのでその辺の備忘メモ 準備 CaboChaは既にインストール済み。 モデル…

Python requests SSLError: EOF occurred in violation of protocol

とあるs付きのAPIにリクエストを投げた時に発生したエラー_φ(・_・ python 2.7.10 opelssl 1.0.1e requests 2.8.1 In [21]: r = requests.get(url) --------------------------------------------------------------------------- SSLError Traceback (most re…

MeCabのドメイン適応(再学習)

MeCabのドメイン適応(再学習)すぐ忘れるので、他にも記事たくさんあるけど、なんとなく備忘メモ(手順だけ)。 MeCab: オリジナル辞書/コーパスからのパラメータ推定まず、MeCabがGoogle Project Hostingから消えてた。。。今はGooglドライブからもろもろ…

ApacheアクセスログをElasticsearchへ流す

Elasticsearchはdockerコンテナで用意、Apache側は落ちてたwordpressのコンテナにtd-agentをインストールしてテスト td-agent 0.12.12 Elasticsearch 1.7.1 td-agent のインストール curl -L https://toolbelt.treasuredata.com/sh/install-ubuntu-trusty-td…

RDBのデータをELKで集計・可視化する

たまにくる「これの件数教えて」とか「Kibana見て」にしたいとりあえずとっかかりとして、MySQLからElasticsearchにデータもってって、Aggregationを触ってみる MySQL入力からElasticsearch出力とか 基本的なSQLの集計クエリをどう置き換えるかとか あたりの…

MacBook AirのPython環境メモ

7月ぐらいから、pyenv、pyenv-virtualenv 使うように変更、その時のメモ1 ) install pyenv $ brew install pyenv $ echo 'eval "$(pyenv init -)"' >> ~/.bash_profile $ exec -l $SHELL2 ) install 2.7.10 #普通にpyenv install 2.7.10 だとzlib extensio…

Sparkコンテナ(勉強用)

Sparkの勉強するのに、また手元の開発環境ごちゃごちゃになるのは困るのでDockerコンテナを作ってみた話。hiropppe/docker-spark-yarngithub.com初め探してsequenceiqのとかあったけど、Dockerのマルチコンテナでのクラスタの組み方とかも勉強したかったので…

Sparkプログラミング ~ IntelliJ IDEAのインストール ~

Spark事始め #事始めではないが、Learning Spark の日本語訳も発売されたことだし、ちょいちょいSparkネタを残しておこう。 #いままでやったことはそのうち整理していく予定ScalaでSparkプログラミングするにはIntelliJがおすすめようなので気分転換がてら…