Corey Blog

「我感觉自己还能抢救一下」

10 分钟搞懂 Hadoop:Docker 搭建最小集群 + WordCount 实战

用 HDFS 存文件、用 MapReduce 做词频统计,一次看懂大数据框架在干什么

很多人听过 Hadoop,但说不清它到底解决什么问题。 这篇文章不讲架构 PPT,而是用 Docker 起一个最小集群,跑通一个 WordCount(词频统计) 例子——这是大数据领域的「Hello World」。 读完后你会知道:Hadoop 不是神秘黑盒,而是 分布式存储 + 分布式计算 的组合。 阅读时间:约 15 分钟(含动手) 环境要求:已安装 Docker /...

从零开始:在 Windows 上装 Ubuntu、Docker,并跑起 Hadoop

WSL 权限、镜像加速、镜像 tag 踩坑全记录

开头:表面问题 vs 真实问题 表面上的目标很简单:在 Windows 本机的 Ubuntu 22.04 里,用 Docker 跑一个 Hadoop(HDFS)容器。 实际跑下来,先后撞上了 三层不同性质的问题: 权限问题 —— 用户不在 docker 组,无法访问 /var/run/docker.sock 网络问题 —— 直连 Docker Hub 超时,需要国内镜像加速 ...

Lambda 与 Kappa 架构:关键概念学习笔记

从批流分离到统一日志,大数据架构选型的概念清单与对照图

学习 Lambda 架构时,最容易陷入「记住了三层名字,却说不清为什么要这样设计」的困境。真正需要掌握的不是名词本身,而是背后的设计权衡和核心概念。 这篇笔记按「概念 → 作用 → 两者关联」整理了我目前收集的 Lambda / Kappa 关键概念,方便日后复习和架构选型。 一、先建立整体图景 Lambda 架构由 Nathan Marz 提出,核心思路是:用批处...

用 B1 英语读 ACM 论文:最终一致性(Eventual Consistency)生词精讲

从一篇分布式系统经典文章出发,整理 60+ 高频词,附中文释义与记忆提示

原文:Peter Bailis & Ali Ghods, Eventual Consistency Today: Limitations, Extensions, and Beyond, Communications of the ACM, May 2013. DOI: 10.1145/2447976.2447992 学习目标:在 B1 词汇量基础上,先背生词再读原文,不要求一...

技术专家10问自查清单

作为一名专业的技术专家,他们往往在学习一个东西的时候,能够看得更加透彻,更加的深刻,这是为什么呢,思考模型是怎样的,究竟怎样学习呢? 为了构建技术专家思维的骨架,我们需要一套思考的方式。 下面来举一个例子,看看常见的学习方式,和专家是如何学习一个知识点的。 比如说:我们需要学习RabbitMq的ACK机制,那么一般的情况,我们就是直接去搜索网上的一些资料,然后稍微的总结和归纳一...

三阶段实战:Playwright CLI + Skills 打造自动 AI 简报系统

三阶段实战:Playwright CLI + Skills 打造自动 AI 简报系统 如果你还在手动搜索、复制、粘贴 AI 行业的新闻,那你还停留在信息获取的 1.0 时代。 真正的 2.0 时代,是你睡一觉醒来,邮箱里已经躺着一份排版精美的《AI 行业简报》,内容包括昨天所有重要的 AI 动态——全过程零人工干预,0 Token 消耗。 这不是科幻。这是 Playwright CLI...

告别重复劳动:Playwright CLI + Skills 实战案例大全

一个最简单的Function Calling 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61...

告别重复劳动:Playwright CLI + Skills 实战案例大全

告别重复劳动:Playwright CLI + Skills 实战案例大全 如果你还在让 AI 帮你写自动化脚本,那你还停留在 AI 编程的 1.0 时代。 真正的 2.0 时代,是你说一句话,AI 自己打开浏览器、点击、输入、抓取数据、生成报告——全过程零人工干预。 这不是科幻。这是 Playwright CLI + Skills 正在做的事情。 本文将用 5 个完整的实战案例,并...

手把手15练:从零学会Playwright CLI浏览器自动化

手把手15练:从零学会Playwright CLI浏览器自动化 全文只有命令和结果,没有废话。打开终端,跟我敲。 作者:Corey 阅读时间:40分钟(含动手时间) 前置要求:电脑能上网,能打开终端 准备工作:5分钟装好环境 在开始任何操作之前,我们需要先把工具装好。跟着下面三步走,不会出错。 第1步:检查Node.js 打开终端(Mac用户找”终端.app”,W...

如何做到全公司第一个发现技术动态?——构建你的技术信息雷达

开篇:那个总是”先知先觉”的同事 你一定有过这样的经历—— 某个周一的早晨,茶水间里大家都在讨论周末发生的某个技术大事件。DeepSeek 发布了新模型、OpenAI 更新了 API、某个框架发布了重大版本更新……周围的人七嘴八舌,信息零零散散。 这时,一个同事慢悠悠地走进来,不仅对这件事了如指掌,还能说出你完全没听过的细节和背景。你问他”你怎么知道的?”,他轻描淡写地回答: ...