跳到主要内容

【实验楼】HBASE教程——学习笔记

· 阅读需 2 分钟

HBase环境搭建与配置

HBase解压即可使用。

【注意】伪分布模式下,HBase需要与Hadoop版本匹配,可以看HBase的lib里Hadoop的jar文件版本。

需要配置hbase-site.xml,可以使用自带的Zookeeper。

单机模式配置如下:

<configuration>
<property>
<name>hbase.rootdir</name>
<value>file:///tmp/hbase-${user.name}/hbase</value>
</property>
</configuration>

Python项目:扇贝网小组查卡助手

· 阅读需 7 分钟

扇贝网是一个非常棒的英语学习网站,大家还可以加入一些小组,一起交流学习、共同进步。但是,小组管理起来非常辛苦,尤其是在0点前踢出不打卡的成员,因此考虑利用程序来实现小组查卡自动化。

登录

操作扇贝网登录
URLhttp://www.shanbay.com/accounts/login/
方式POST
数据csrfmiddlewaretokenCSRF令牌
username用户名
password密码

Ubuntu搭建Ruby on Rails环境

· 阅读需 2 分钟

安装Ruby

由于Ubuntu的apt包管理器的ruby版本过旧,故考虑从源码编译安装。这里以安装ruby2.3.0为例:

sudo apt-get install build-essential zlib1g-dev libssl-dev libreadline6-dev libyaml-dev
cd /tmp
wget https://cache.ruby-lang.org/pub/ruby/2.3/ruby-2.3.0.tar.gz
tar -xvzf ruby-2.3.0.tar.gz
cd ruby-2.3.0/
./configure
make
sudo make install

Python爬虫入门案例:获取百词斩已学单词列表

· 阅读需 3 分钟

百词斩是一款很不错的单词记忆APP,在学习过程中,它会记录你所学的每个单词及你答错的次数,通过此列表可以很方便地找到自己在记忆哪些单词时总是反复出错记不住。我们来用Python来爬取这些信息,同时学习Python爬虫基础。