llussy

人生中有些事你不竭尽所能去做,你永远不知道你自己有多出色。

kubernetes 常用操作

常用命令 kubectl logs mypod --previous kubectl delete pod -n kube-system test-q2ngc --grace-period=180 kubectl delete pod <pod> --force --grace-period=0 kubectl exec -it -n monitoring test-f7bdb...

linux strace

[toc] strace 参数 -tt 在每行输出的前面,显示毫秒级别的时间 -T 显示每次系统调用所花费的时间 -v 对于某些相关调用,把完整的环境变量,文件stat结构等打出来。 -f 跟踪目标进程,以及目标进程创建的所有子进程 -e 控制要跟踪的事件和跟踪行为,比如指定要跟踪的系统调用名称 -o 把strace的输出单独写到指定的文件 -s 当系统调用的某个参数是字符串时,最多输...

database troubleshooting

mysql [TOC] 向mysql导入数据失败(MySQL server has gone away) mysql日志中报错[Warning] Aborted connection 5 to db: 'iamstigris' user: 'root' host: 'localhost' (Got a packet bigger than 'max_allowed_packet' by...

kubernetes troubleshooting

[toc] node相关 node维护 由于硬件问题或其他原因,node节点需要停机维护。 1.禁止新调度 到node上 kubectl cordon k8snode 2.驱逐这个node的容器 过程比较慢 kubectl drain k8snode --ignore-daemonsets 3.解锁禁止调度。恢复业务 kubectl uncordon k8snode 内核...

hadoop troubleshooting

[toc] hive HIVEMETASTORE_PAUSE_DURATION # 报错信息 The health test result for HIVEMETASTORE_PAUSE_DURATION has become bad: Average time spent paused was 37.1 second(s) (61.91%) per minute over the p...

kakfa常用命令

[toc] 重启 /usr/local/kafka_2.11-2.0.0/bin/kafka-server-stop.sh sleep 3 /usr/local/kafka_2.11-2.0.0/bin/kafka-server-start.sh -daemon /usr/local/kafka_2.11-2.0.0/config/server.properties 列出/删除to...

prometheus结合consul

promethues结合consul可以实现自动发现,可以把一些需要收集的信息(metrics)上报到consul,prometheus会自动去consul中拉取。 启动一个consul # 这里只作测试,线上确保consul高可用 consul agent -server -dev -ui -data-dir /data/consul -client=192.168.1.1 -b...

hadoop常用命令

hdfs sudo -u hdfs hdfs dfsadmin -report #查看hdfs使用率 hdfs dfs -copyFromLocal /data/app_tmp/hippoZip/2018-05-29/ /hippo/hippo/hippoZip/ #上传 sudo -u hdfs hdfs dfs -mkdir /lisai #创建目录 #检测损坏的block,然...

couchbase介绍

couchbase Couchbase服务器可以单独运行,也可以作为集群运行。在Couchbase集群里,运行一个或多个Couchbase实例。集群里所有节点是相等的,提供相同的功能和信息,没有层次结构或者拓扑的概念,也没有主节点、从节点之分。整个集群共享每个独立节点的信息,每个节点负责对数据的一部分进行响应。 集群是水平扩展的。要增加集群的容量,你只需加多一个节点。节点间没有父子关系或者...

mongo replicas

[TOC] mongo节点 Priority 优先级 优先级用于确定一个倾向成为主节点的程度。取值范围为0-100,Priority 0节点的选举优先级为0,不会被选举为Primary,这样的成员称为被动成员。 对于跨机房复制集的情形,如A,B机房,最好将『大多数』节点部署在首选机房,以确保能选择合适的Primary 对于Priority为0节点的情况,通常作为一个standby,或由...