Blog

記事 Articles

Thoughts on AI, technology, and building products.

Filter by tags

28 articles

April 6, 2026•35 min

由 Prompt Engineering 到 Context Engineering 到 Harness Engineering：AI 工程三部曲嘅進化史

深入解析 AI 工程由 Prompt Engineering（2022-24）到 Context Engineering（2025）到 Harness Engineering（2026）嘅進化歷程。了解 Karpathy、Tobi Lütke、Anthropic、OpenAI、LangChain 點樣定義呢三個時代，附完整實戰指南同代碼範例。

AINLP

April 5, 2026•35 min

Person ReID 進化史：由 TransReID 到 SOLIDER 到 DINOv2，Transformer 點樣統治行人重識別？

深入解析 Person ReID 由 CNN 時代到 Transformer 時代嘅三大里程碑：TransReID（首個 pure Transformer ReID）、SOLIDER（語義可控自監督預訓練）、DINOv2（通用視覺基礎模型）。了解 JPM、SIE、語義控制器等核心設計，附完整實作指南。

Computer VisionAITransformer+1

April 4, 2026•30 min

OSNet：點解一個 2.2M 參數嘅輕量 CNN 可以打贏 ResNet50 做 Person Re-ID？

深入解析 OSNet（Omni-Scale Network），一個專為行人重識別設計嘅輕量 CNN。了解點樣透過 multi-scale streams + unified aggregation gate 學習 omni-scale features，用 2.2M 參數打贏 24M 嘅 ResNet50。

Computer VisionAIImage Processing

April 1, 2026

乜嘢係 1×1 Convolution？點解佢可以又慳參數又做跨 Channel Mix？

用廣東話拆解 1×1 convolution（pointwise conv）：由 Network in Network 到 ResNet bottleneck，再到 MobileNet depthwise separable，講清楚佢點樣做 channel mixing、降/升維同加速。

Computer VisionAI

March 26, 2026•50 min

TurboQuant：Google 用 3-bit 壓縮 KV Cache 做到零精度損失嘅突破

深入解析 Google Research 發表嘅 TurboQuant 論文，了解點樣透過 PolarQuant + QJL 兩階段量化，將 LLM KV cache 壓縮到 3-bit 而保持零精度損失，仲有 8x speedup

Inference OptimizationAITransformer

February 9, 2026•15 min

Quantum Teleportation：瞬間移動嘅數學與物理（連埋 Cheat Sheet 拆解）

完整數學推導 Quantum Teleportation（量子隱形傳態）嘅原理，從 Bell State 建立到測量修正，附帶實用 Cheat Sheet 同埋直觀比喻解釋。

QuantumCMSC 5711AI

February 6, 2026•40 min

BullMQ vs Redis Streams vs RabbitMQ：Node.js Message Queue 完全對比指南

深入對比 Redis Pub/Sub、Redis Streams、BullMQ 同 RabbitMQ 四大 Message Queue 方案，解析點解 Redis Pub/Sub 唔適合做 Job Queue，Redis Streams 點樣處理持久化消息流，BullMQ 點樣構建可靠嘅背景任務處理系統，RabbitMQ 幾時先係最佳選擇，附完整實戰代碼同場景推薦

NLPWeb Development

February 5, 2026•20 min

LLM Pre-training 架構詳解：Decoder-Only、Encoder-Only、Encoder-Decoder 嘅分別同訓練方式

深入探討 LLM pre-training 嘅三大架構：Decoder-Only (GPT)、Encoder-Only (BERT) 同 Encoder-Decoder (T5)，分析佢哋嘅訓練方式、優缺點、實際應用場景，同埋點解 Decoder-Only 成為主流。

AINLPCSCI 5640 NLP

February 5, 2026•15 min

Telegram vs WhatsApp：點解 Telegram 咁注重私隱？

深入比較 Telegram 同 WhatsApp 嘅私隱保護機制，了解點解 Telegram 被視為更私隱導向嘅通訊平台，分析加密方式、數據收集、同埋伺服器架構嘅分別。

PrivacyPersonal

February 4, 2026•25 min

FlashAttention 1, 2, 3, 4 完全解析：由 IO-Aware 到 Blackwell Petaflop

深入解析 FlashAttention 四代演進：從 FlashAttention 1 嘅 IO-aware tiling，到 FlashAttention 2 嘅並行優化，再到 FlashAttention 3 嘅異步計算同 FP8 支援，最後到 FlashAttention 4 喺 Blackwell B200 突破 1.6 PetaFLOPs，了解點樣將 Transformer Attention 推向極致

Attention MechanismsInference OptimizationHardware Acceleration+1

February 4, 2026•15 min

解構 WanVideo 2.2：雙專家接力嘅 AI 影片生成工作流

深入解析 WanVideo 2.2 點樣透過 Mixture-of-Experts (MoE) 架構，用高噪點同低噪點兩個專家模型接力，喺 ComfyUI 生成電影級 AI 影片

Video GenerationDiffusionImage Processing

February 4, 2026•15 min

Screen 命令完全指南：點樣喺 SSH 斷線後繼續跑緊你嘅程式

深入淺出講解 Linux Screen command，包括基本用法、實戰場景、Screen vs tmux 對比，以及生產環境最佳實踐

LinuxDevOps

February 3, 2026•20 min

Glyph 同 Vist：點解將文字變圖像反而更慳 Tokens？

深入探討 Glyph 同 Vist 兩篇突破性論文，了解點樣透過將文字 render 成圖像再用 vision encoder 壓縮，實現 slow-fast 混合架構處理超長語境

Visual TokensOCRTransformer+1

February 3, 2026•20 min

AI 戰爭機器選購指南：RTX 6000 Pro Blackwell、Threadripper 同企業級伺服器深度對比

深入探討 AI 訓練工作站嘅硬件配置，包括 NVIDIA RTX 6000 Pro Blackwell、AMD Threadripper、PCIe 5.0、多 GPU 配置，以及雙風扇、渦輪式、被動散熱等冷卻方案嘅技術細節

GPUHardware

February 3, 2026•12 min

DeepSeek OCR: How Visual Token Efficiency Revolutionizes Document Understanding

Discover how DeepSeek OCR achieves state-of-the-art document parsing with only 1120 visual tokens—6x fewer than competitors—through innovative visual causal flow and semantic reordering.

OCRVisual TokensTransformer+1

February 2, 2026•20 min

量子電路入門：Dirac Notation、量子閘同 Hadamard Gate

深入探討量子電路嘅基礎概念，包括 Dirac notation（bra-ket）、常見量子閘（Pauli Gates、CNOT、SWAP）、Hadamard Gate 同埋點樣用量子電路構建量子演算法

Quantum

February 1, 2026•10 min

NVIDIA DGX Spark + Mac Studio：EXO 1.0 混合架構實現 4 倍 LLM 加速

深入拆解 EXO Labs 最新方案：點樣結合 NVIDIA DGX Spark 嘅強大算力同 Mac Studio 嘅高記憶體頻寬，透過分離 Prefill 同 Decode 階段，實現 4 倍 LLM 推理速度提升。

Inference OptimizationGPUHardware

February 1, 2026•18 min

Lexapro (Escitalopram) 完整指南：SSRI、MDD 同用藥須知

深入了解 Lexapro (Escitalopram) 嘅作用機制、SSRI 藥理、重性抑鬱症 (MDD) 成因同類型、藥物相互作用、安全用藥指引等全面資訊。

Mental Health

February 1, 2026•10 min

Next.js Server-Side Rendering 同 SEO：force-dynamic 點樣保持搜尋引擎優化

深入探討 Next.js 三種 rendering 策略（SSG、SSR、CSR）對 SEO 嘅影響，解析 force-dynamic 點樣喺 server-side 生成完整 HTML，確保搜尋引擎可以正確 crawl 你嘅內容

Next.jsSEOWeb Development

February 1, 2026•25 min

State Space Models (SSM)：由 Mamba 到 S4 嘅演變

深入探討 State Space Models 的原理、架構演變，以及點解佢哋可以挑戰 Transformer 的地位

SSM / MambaCSCI 5640 NLP

January 29, 2026•40 min

DeepSeek-OCR 2：點樣教 AI 好似人咁「睇」文件？Visual Causal Flow 完全拆解

用廣東話深入拆解 DeepSeek-OCR 2 論文：由 raster-scan 嘅根本問題、DeepEncoder V2 嘅 dual-stream attention、causal flow queries 到 cascade causal reasoning，附具體數字例子、attention mask 推導、同完整 inference code。

OCRVisual TokensTransformer+1

January 29, 2026•25 min