杜克大学商业分析笔记(一)

📅 2026-06-18 19:38

杜克大学商业分析笔记（一）

001：关于本专业课程 🚀

欢迎来到激动人心的商业数据分析领域。我在此行业工作了20年，从未感到厌倦。你也不会感到厌倦。随着全球大数据分析文化的真正潜力得以实现，未来20年将更加令人兴奋。

我是一名研究大脑中大数据的神经科学家。我现在处理各种数据集，并将我们在大脑研究中发现的统计技术和问题解决技术应用于商业领域。这对我来说非常有趣，因为事实证明，由于大数据生态系统，我们在科学领域面临的许多分析挑战，现在也正是商业领域面临的分析挑战。

我们在科学领域发表论文所使用的技能，与向高管汇报所使用的技能是相同的。这一切都关乎批判性思维、数据整理和沟通。

我曾作为一名发明家和企业家，创造了新的数据分析技术。我也曾作为风险投资人，帮助他人实现他们在商业分析领域的梦想。在过去的六年里，我一直在杜克大学全球知名的工程管理硕士项目中担任教师。

我们的重点是实践性，即如何帮助你利用数据创造积极的变化。

在商业世界中，大数据只是一个简称，它指的是我们过去所有需要记录的东西，比如产品发票、医生处方，现在都电子化并存储在计算机中。这意味着它们可以被搜索、探索、分析，甚至可能被利用。

电子数据的存储成本已经变得非常低，以至于丢弃数据并不能节省任何成本。这些数据中的大部分最终可能被证明是无用的，但聪明的人们将在未来20年里，不断寻找新的方法来利用其中的一部分，创造具有经济价值的产品和服务，或者为他们已经销售的产品和服务，提取暂时的或持久的信息优势，即一个有意义的竞争优势。

任何处于竞争市场中的商业性盈利公司，如果不将商业数据分析的最佳实践融入其运营中，在未来五年内都无法保持盈利，甚至无法生存。

要高效利用所有这些大数据，需要理解一个数据问题的完整生命周期。这个生命周期包括收集数据、清理数据、分析数据以及向人们传达其含义。

世界不仅需要能够驾驭整个周期的人，还需要能够整合和翻译所有参与其中的人员的语言的人，这些人包括从程序员到统计学家，再到沟通专家和业务领域专家。

信不信由你，这类人曾被大众媒体称为“独角兽”。这是因为很难想象一个人能掌握所有这些技能。

然而，我们在这里要告诉你，所有这些技能都可以被一个人掌握。本专业课程旨在帮助你迈出第一步，成为你自己的大数据“独角兽”。

当你完成最终的毕业项目时，你将掌握基本的商业概念和解决问题的技能，以帮助你在大数据生态系统中游刃有余。同时，你也会掌握商业分析最重要的工具，包括在Excel中进行数据建模、使用Tableau理解和沟通数据，以及使用SQL组装数据。

你们中的一些人可能已经掌握了部分内容，但我们感兴趣的是弥合差距，帮助你们都成为“翻译者”。我们希望帮助没有技术背景的商业人士熟悉数据，也希望帮助有技术背景的人学会提出最佳类型的商业问题。

我们都相信，无论你的技术背景如何，大数据分析都是你能从事的最有价值的领域之一。最激动人心的发展还在未来。

感谢你与我们一同踏上这段旅程。

在本节课中，我们一起学习了商业数据分析领域的广阔前景和核心价值。我们了解到，大数据本质上是商业活动的电子化记录，其分析生命周期涵盖收集、清理、分析和沟通。课程的目标是培养能够驾驭整个周期、连接技术与商业的“翻译者”或“独角兽”型人才。无论你的起点如何，掌握Excel、Tableau和SQL等工具，结合批判性思维，都将为你在这个充满机遇的领域取得成功奠定基础。

002：课程引言 🎯

在本节课中，我们将概述完成《Excel 到 MySQL：商业分析》课程后，你将能够掌握的核心技能与知识。课程旨在帮助你从海量数据中识别关键商业指标，理解数据分析在不同行业和角色中的应用，并为从事商业分析或数据科学相关职业做好准备。

课程完成后的能力目标 📈

完成本课程后，你将能够达成以下目标。

模块二：掌握商业指标

上一节我们介绍了课程的整体目标，本节中我们来看看第一个核心模块。完成模块二后，你将能够做到以下几点。

以下是模块二的具体学习成果：

你将能够区分哪些数字对企业的健康与成功至关重要（即商业指标），并将其与企业日常面临的大量其他实用性较低的数据区分开。
你将能够对任何商业指标进行初步分类。
你将能够判断一个指标属于三大类商业数据中的哪一类：收入、盈利能力或风险。
你将能够区分传统指标与我们在此所称的动态指标。动态指标通常较新，通过快速改进业务流程，具有引领创新的最大潜力。

模块三：理解数据岗位与公司类型

在掌握了商业指标的分类后，我们接下来需要了解这些指标由谁来分析和应用。完成模块三后，你将能够做到以下几点。

以下是模块三的具体学习成果：

你将能够预见不同类型的企业需要哪些以数据为中心的员工。
你将了解在各类公司中常见的职位名称和技能要求，以及不同角色的员工通常如何协作。
你将直接聆听从事数据相关工作的商业分析师、商业数据分析师、数据科学家和高级软件工程师的分享。
我们将把所有公司分为五类，并思考每类公司如何应对大数据的影响。
你甚至能够使用一份包含20个项目的清单，为你自己的公司或任何其他公司单独评分，以确定其接纳大数据分析文化的程度。

模块四：应用最佳实践分析指标

了解了“谁”来分析数据之后，我们来看看“如何”进行有效分析。完成模块四后，你将能够做到以下几点。

以下是模块四的具体学习成果：

你将能够识别当前分析商业指标的企业最佳实践。
你将学习一些简单但强大的公式，以从这些指标中提取最大价值。例如，计算客户生命周期价值的简化公式：CLV = (平均购买价值 × 购买频率) × 客户平均生命周期。
我们将研究一个至关重要的横向业务领域——网络营销，它几乎与商业世界中的每一家公司都相关。
我们将探索一个代表性的垂直市场——与投资和投资组合管理相关的金融服务，以便你熟悉一组指标如何协同工作来定义一个市场领域。

课程总体目标与价值 💎

本节课中我们一起学习了各模块的具体目标。本商业分析专项课程的总体目标是，如果你选择从事商业分析师或商业数据分析师的工作，或计划开启通往数据科学家的职业道路，亦或只是希望在数据于业务流程中扮演越来越核心角色的当下，在当前职位上更有效率，本课程都将为你取得成功做好准备。

我们认为，无论你的角色是什么，学习如何像商业分析师或商业数据分析师一样高效工作都非常有用。世界似乎正被数据的海洋淹没，其中许多数据并无太大用处。

学完本课程后，你将能够从这片海洋中找到宝藏——识别并利用那些让数据驱动型公司蓬勃发展的关键指标。

003：指标如何帮助我们提出正确问题 📊

在本节课中，我们将探讨商业分析师的核心价值，并学习如何利用“指标”来提出正确的问题，从而驱动有效的商业决策。

概述

商业分析师或商业数据分析师最高且最佳的用途是什么？答案是：找出正确的问题来提问。然后，在有限的时间和资源内，尽可能找到最佳的答案。同时，确保你的答案能产生实际影响，即将其转化为具体的行动号召，并使用视觉隐喻和非技术性语言，将具体的建议行动传达给相关的决策者。

什么是“正确的问题”？

那么，什么才是“正确的问题”呢？答案是：为了增加收入、最大化利润或降低风险，我们现在能够且应该对业务流程做出何种改变？

这里的关键词是“现在”。接下来，我们将详细探讨“现在”的不同含义。

理解“现在”的含义

“现在”一词在商业决策中有多个层面的含义。以下是几种不同的解释，从最理想的情况到更实际可行的方案。

理想情况：实时优化 最理想的答案是：公司已经建立了实时计算机化系统。这些系统通过调整我们对客户和市场输入的响应，来优化某些动态指标，其处理延迟或等待时间不超过零点几秒。公式可以表示为：决策 = f(实时数据输入)。
次优方案：及时响应 当无法实现计算机化自动响应时，次优方案是“及时响应”。这意味着由人工来响应单个客户，并且该员工能够访问该客户与公司互动的完整历史记录，无论是通过购买、客服电话，还是在网站上的行为等。
实用方法：基于测试的迭代 第三种方案虽然不如前两者即时，但仍然非常有效。即我们所建议的变更无法一夜之间完成，但可以在经过实证测试并证明有效后尽快实施。我们通过A/B测试来进行验证：每次只对网站做一个小改动，创建A和B两个不同版本，然后比较哪个版本表现更好。通常，一项A/B测试可以在建议提出后的30天内开始，并且一旦收集到足够数据确定一个选择明显优于另一个，就可以实施建议的变更。其核心逻辑是：变更决策 = 基于(版本A表现数据 > 版本B表现数据)。

指标的核心作用

上一节我们探讨了决策的时效性，本节中我们来看看“指标”在其中扮演的核心角色。

指标是特殊的数字，它们帮助我们提出并回答正确的商业问题：我们应该做出什么决策？我们现在应该改变什么流程？

指标是那些当我们改变业务流程时，能够对其产生影响的数据。为了更清晰地理解，我们来看一个例子。

指标 vs. 固定事实

理解什么是指标，同样需要明白什么不是指标。以下通过一个对比来说明。

假设有一家扎根于北卡罗来纳州的实体服装零售店，该州的销售税率为4.75%。

销售税不是指标。我们无法通过改变业务流程来影响它。它对我们来说就像一个固定事实，类似于天气。
广告点击率是一个指标。例如，在特定网站上看到我们的广告后，点击链接访问我们主页的用户百分比。这个数字会随着广告内容和外观的改变、广告投放时段或网站的变化而不断变化。我们可以通过优化这些因素来直接影响这个百分比。

总结

本节课中，我们一起学习了商业分析的核心目标是提出正确的问题。我们明确了“正确的问题”通常围绕“立即优化业务流程”展开，并探讨了“立即”的三种不同实现方式：实时系统、及时响应和A/B测试。最重要的是，我们定义了指标——那些能被我们行动所影响的特殊数字——是连接问题与答案、驱动有效商业决策的关键工具。通过区分指标（如点击率）和固定事实（如税率），我们能更精准地聚焦于可优化、可行动的领域。

004：区分收入、盈利能力和风险指标 📊

在本节课中，我们将学习如何将商业指标分为三大类别：收入指标、盈利能力指标和风险指标。理解这些类别的区别，有助于我们更清晰地分析企业的健康状况和运营表现。

概述

所有商业指标都可以归入三大类别：收入指标、盈利能力指标和风险指标。区分一个具体指标属于哪一类，一个有效的方法是思考公司里哪些人依赖这些信息并会主动索取它。

收入指标 💰

收入指标与销售和市场营销活动直接相关。它们是外向型的指标，告诉我们公司在营销和销售其产品方面表现如何。

以下是销售和营销团队通常关心的收入指标：

销售团队（通常由销售副总裁领导）希望了解：

在特定时间段内，每种产品售出了多少单位。
与去年同期或前年同期相比的销售情况。
按地区、产品和客户类型（新客户 vs. 回头客）划分的销售数据。
销售漏斗的状况，即已识别的潜在客户在逐步转化为购买者的过程中所处的阶段。

营销团队（通常由营销副总裁领导）希望了解：

营销活动的效果如何。
有多少人看到了特定的广告、营销邮件或邮寄优惠。
响应率是多少。

核心概念：任何与销售直接或间接相关的内容都属于收入指标。

盈利能力指标 📈

上一节我们介绍了外向型的收入指标，本节中我们来看看内向型的盈利能力指标。这些指标与公司创造并向客户交付产品和服务的流程效率有关。

以下是公司内部负责运营的人员（在大公司中通常由首席运营官领导）所关注的效率指标：

以未售出库存形式占用了多少现金。
由于损坏或浪费导致多少产品无法销售。
公司因生产或库存不足而无法满足紧急客户需求、从而损失销售机会的频率。
生产线上有多少比例的产品因缺陷被拒收。
每单位产品在可变成本、原材料和劳动力上的花费。

核心概念：盈利能力 = 收入 - 成本。即使一家公司收入庞大且增长迅速，如果无法高效交付产品，也无法实现盈利。相反，收入增长空间有限的老牌公司，通常可以通过专注于提高运营效率来实现盈利能力的显著增长。

风险指标 ⚠️

最后，我们来看看风险指标。这些指标与追踪并尽可能减少公司面临的诸多潜在危险有关。

风险指标的例子包括：

净现金消耗率：如果公司每月将净现金流的很大一部分用于支付债务利息，那么即使是外部冲击（如经济衰退）导致的收入小幅下降，也可能使公司资不抵债并倒闭。跟踪公司以当前消耗率还能生存多少个月至关重要。
客户流失率：对于采用订阅制收入模式的公司，如果客户流失率（新订阅者在一年内取消订阅的比率）非常高，公司将面临风险。随着时间的推移，从未成为客户的目标人群会越来越少，维持收入增长甚至保持稳定将变得不可能。
金融业特定指标：例如，银行会追踪其面临的潜在客户违约风险敞口，以及预计在未来六个月内违约或当前已违约的客户比例。基金经理则使用回报波动率和最大历史回撤（从历史最高点的最大跌幅）作为其投资组合风险敞口的代理指标。

核心概念：大多数风险指标都以某种方式与杠杆相关。任何生存依赖于偿还大量借款能力的实体，都会因任何不幸而面临被放大的风险。

总结与记忆技巧 🧠

本节课中，我们一起学习了商业指标的三大类别：

收入指标：面向乐观的外向者（销售与营销）。
盈利能力指标：面向一丝不苟的完美主义者（运营与生产）。
风险指标：面向掌握信息的怀疑论者（风控与投资）。

一家优秀的公司会善用这三种特质，并同时追踪这三类指标，从而获得全面的商业洞察。

005：区分传统指标与动态指标 📊

在本节课中，我们将学习如何区分传统商业指标与动态商业指标。理解这两者的差异对于进行快速、有效的商业决策至关重要。

传统商业指标概述 📄

传统商业指标包括标准的财务和管理会计类别，例如季度净现金流报表、损益表以及资产负债表项目（如股东权益）的变化。

这些传统商业指标主要起源于纸笔记录的事后报告。其中一些指标在历史上也曾是创新之举，例如大约500年前意大利佛罗伦萨的银行家发明的复式记账法。

基于这些指标做出的商业决策通常需要经过长时间的审议，有时甚至需要数月到数年的时间。它们仍然极其重要，值得我们深入研究，但现代商业环境往往要求更快的反应速度。

动态商业指标的定义与特征 ⚡

上一节我们介绍了传统指标的特点，本节中我们来看看动态商业指标。我们想要的是动态商业指标。

动态商业指标的定义和传达方式应能体现紧迫感。这类指标旨在解决正确的问题：我们现在可以对业务流程做出哪些改变，以增加收入、最大化利润或降低风险？

一个商业指标要成为动态指标，需要具备两个属性。

以下是第一个属性：

指标是否会在一个月或更短的时间间隔内发生显著变化？ 如果不是，那么它就不够动态。例如，一家商场内的独立零售店为其三年期房地产租赁支付的月租金，当然是一个与其效率和盈利能力相关的商业指标，但它不是一个动态商业指标。追踪它没有意义，因为它短期内不会改变。

以下是第二个属性：

公司是否可以采取具体行动，在短期内显著影响该指标？ 如果不能，那么该指标就不适合进行动态追踪。一个指标是否动态也可能取决于具体的商业背景。

动态指标的商业背景依赖性 🏪

为了理解商业背景如何影响指标的动态性，让我们来看一个例子。

如果前面提到的拥有1000家门店的零售连锁店既不新增也不关闭门店，只是续签现有空间的租约，且旧租约已有预先商定的续约条款，那么要显著影响每平方英尺的平均月租金将非常困难。

另一方面，如果该零售连锁店公开宣布将关闭其在美国25%的零售门店（正如Gap公司在2015年6月所做的那样），它就可以向房东提出新的方案：要么我们在当前租约结束时离开，你需要寻找可能支付更低租金的新租户；要么我们现在就重新谈判租约条款。

在这种情况下，新谈判租约的每平方英尺平均月租金对Gap公司而言就是一个动态指标。这是一个可以节省成本的领域。这也解释了为什么将所有坏消息一次性公布通常是一种良好的商业策略。

动态指标的敏感性与影响力 📈

商业变革对指标能产生多大影响，是判断其是否为动态指标时需要观察的另一个重要方面。

如果指标“噪音”很大，意味着有许多因素在影响它。如果指标“敏感”，则意味着它能非常具体地反映我们所采取行动的效果。

像季度收入这样的传统指标受到数十种不同因素的影响，其中许多完全超出了我们业务的控制范围。如果我们的大多数客户是销售周期很长的政府机构，那么我们推出的出色新广告活动甚至可能不会在季度收入指标中显现出来。

总收入始终是一个汇总数字。正如Ki metrics网站上所说，汇总数据某种程度上是毫无价值的。而动态指标是敏感的。我们流程中的微小变化可以带来巨大的影响。

例如，将商品加入在线购物车并最终完成购买的用户比例，对平均页面加载时间极其敏感。研究表明，加载时间超过3秒的页面促成销售的可能性远低于加载时间少于3秒的页面。40%的网络用户会完全放弃加载时间超过3秒的网页。

这就是为什么存在一个专门致力于“边缘缓存”的行业，例如Akamai等内容交付网络。零售店付费让这些网络在全球各地靠近客户的位置本地存储其网站副本，从而节省宝贵的几秒加载时间。

顺便提一下，通过我的杜克大学学生最近为一家网站性能监控公司做的项目，我们了解到在移动设备上，许多零售公司的网页加载需要20秒或更长时间。看来许多全球零售公司尚未从世界各地的远程位置测试其基于移动设备的加载时间。

如果你的公司尚未在所有活跃的全球市场中，对移动设备进行加载时间性能测试，那么应该立即开始。

总结 🎯

本节课中我们一起学习了传统商业指标与动态商业指标的关键区别。传统指标（如季度财务报表）源于历史报告，变化缓慢，决策周期长。动态指标则具备两大特征：在短周期（≤1个月）内显著变化，以及公司可通过具体行动在短期内显著影响它。动态指标对业务流程的微小变化非常敏感（例如页面加载时间对电商转化率的影响），能直接指导快速行动以提升收入、利润或降低风险。理解并选择正确的动态指标，是现代商业分析的核心。

006：定义 ☕

在本节课中，我们将通过一个案例研究，来阐明盈利能力指标与现金流指标之间的关键区别。案例研究的第一部分，我们将讨论一些财务定义。

商业分析并非财务会计，但它确实会借鉴一些会计概念来构建其指标。我们将简要介绍，在接下来的约10分钟里，我会引导你了解所有需要掌握的、理解核心商业指标所必需的财务会计术语和概念。

我将通过一个我正在筹划的初创企业——埃格斯烘焙咖啡——的例子来解释这些最重要的术语。

商业模式概述

埃格斯烘焙咖啡计划批量购买生咖啡豆，进行烘焙和包装，然后以更高的价格批发销售给一家连锁超市。

在下一个视频中，我们将探讨当埃格斯烘焙咖啡面临不同类型的增长情景时会发生什么。我们将展示，即使从利润角度看情况良好，快速增长情景在现金流方面实际上可能非常危险。现金流和利润是两个截然不同的概念，因此公司的财务报告会分别讨论它们。

利润体现在损益表中，而现金流则体现在现金流量表中。不盈利的公司可以生存并蓬勃发展数年甚至数十年，例如亚马逊。但那些耗尽现金的不盈利公司，则会像E Toys、或Webvan一样消失得无影无踪。

即使是利润丰厚的公司，如果无法足够快地满足其短期现金义务，也可能倒闭，就像2008年秋天世界上最大、最盈利的保险公司AIG在几天内发生的情况一样。盈利的公司实际上也经常因为耗尽现金而倒闭。引发此类灾难最常见的原因之一就是不受控制或计划外的销售增长。成功来得太快、太多，可能会毁掉你。

我将通过埃格斯烘焙咖啡的两种不同收入情景来说明这种危险：情景1，涉及安全、稳定的收入；情景2，快速增长、令人兴奋但最终致命的销售增长。作为你的老师，如果我不在开始做任何其他事情之前，确保你的公司永远不会因为无法追踪正确的商业指标而耗尽现金，那我就没有尽到我的职责。

所有关于埃格斯烘焙咖啡商业模式的假设、本视频及下一个视频中讨论的财务术语和概念，以及案例研究中的两种情景，都在一个详细的Excel电子表格中列出，你可以下载。我建议你在观看视频后、参加本课测验前，仔细复习电子表格中的材料。

埃格斯烘焙咖啡的商业模式

如前所述，我正在创办一家咖啡烘焙企业。我的商业模式很简单，我认为它肯定会成功。我有个朋友在一家大型零售连锁超市担任采购员，他承诺以每磅6美元的价格（批发价）从我这里购买我能生产的所有埃格斯烘焙咖啡。

我将与这家连锁超市签订一份供应合同，同意按需交付咖啡，但如果我未能按时足额交付，将面临财务处罚。不过，这个价格保证我每磅都能获得利润。我的朋友认为他的大型连锁超市可以销售无限量的咖啡。我们将把这种咖啡作为手工制作、正宗的产品进行营销，由我个人在北卡罗来纳州达勒姆市精心烘焙。

收入与付款条件

连锁超市平均在收到商品60天后向其所有供应商（包括我）付款。这给了他们时间自己销售商品。这些是常见的条款，称为净60天。我预计从我收到生豆到完成烘焙、包装和交付的平均时间为30天。

成本结构

我已经找到了一个批量采购高品质生咖啡豆的来源，价格为每磅2美元。他们的条款是货到付款。也就是说，豆子送到我家门口时我就付款。

可变成本

可变成本是指我烘焙的豆子越多，成本就越高的项目。最明显的例子就是我刚才提到的生豆本身。我每磅支付2美元，如果多买一磅，就再付2美元。这就是可变成本。

对我来说，其他生产可变成本包括烘焙过程中使用的燃料、包装豆子的纸质包装、帮助将生豆装入烘焙机和将烘焙好的包装豆装上送货卡车的工人的小时工资，以及将豆子交付给我的客户商店的运输成本。我预计所有这些额外的可变成本约为每磅2美元。

因此，我预计总可变成本约为每磅 4**。 #### 资本投资与折旧 <540,000。它应该能用三年才需要更换。我计划用现金支付。

我计划总共向这家企业投入 800,000** 现金作为启动资金，这样在开始运营时，我银行里还会有 **260,000 的充裕现金缓冲。在紧急情况下，我还可以向朋友和家人额外借入最多 800,000**。从财务会计的角度来看，为了确定我是否以盈利的价格销售咖啡，我需要找到一种方法，将我已经花在机器上的 **540,000 计入烘焙豆子的成本中。我可以说第一磅咖啡花了我 540,004**，但这不公平。后面的磅数就可以免费使用烘焙机了。 <540,000 这个金额，在一段时间内进行分配或分摊，使得这笔钱的一部分被分配到机器烘焙的每一袋咖啡上。

基于咖啡烘焙机的使用寿命为三年的想法，我将把 540,000** 的购买价格分摊到三年或36个月中。每月 **15,000。如果我每月生产 25,000 磅豆子，将这笔成本平均分配到每磅上，会导致我每磅销售的利润减少 15,000 / 25,000 = 0.60。

这种因为设备随时间损耗而分配资本支出的方法称为折旧。我知道机器实际上并不是完全均匀地损耗，但我们在会计中经常做这种假设。你可以想象一条向右下方倾斜的直线，所以假设机器每月价值正好减少 15,000**。 <10,000 的G&A费用分摊到25,000磅产量上，第一年应该是 10,000 / 25,000 = 0.40 每磅。如果我的产量增加，我的每磅成本将会下降。

初步盈利预测

因此，在我提出的模型中，以每磅 6** 的售价和第一年 **300,000** 磅的销量来看，我的可变成本为每磅 **4，加上固定成本每磅 1**，第一年应该能带来每磅 **1 或总计 300,000** 的利润或净收益。 <25,000 的利润。

潜在风险：现金流视角

那么，可能会出什么问题呢？从盈利能力的角度来看，这个生意看起来很棒。但如果从现金如何流入和流出公司银行账户的角度来看，情况就不那么令人放心了。现金流分析的核心是关于时机。

你可能还记得，我们为新的豆子支付货到付款。然后我们需要另外30天来处理豆子，才能将它们送到客户那里。客户然后按净60天的条款支付给我们。这意味着平均而言，当我们收到订单时，我们在同一天支出现金，但客户在90天后才支付现金给我们。

这种情况被称为负浮存金，在各种类型的商业中都非常普遍。我要指出，某些企业如保险和银行业，是现在收到现金，以后提供服务。这是一种令人愉快的情况，称为正浮存金。

然而，客户因已交付产品而欠我们、但我们尚未收到付款的钱，被称为应收账款。所以我们交付了东西，然后我们就有一笔应收账款，直到这笔钱被支付。为了计算我们的损益，这笔钱已经被确认了，但它不会出现在我们的现金流量表上，因为我们实际上还没有拿到它。

我们通过一个称为账龄应收账款的指标来追踪这些我们尚未收到的钱被欠了多久。

好了，以上就是你需要了解的所有财务会计知识。

总结

在本节课中，我们一起学习了埃格斯烘焙咖啡案例研究的第一部分，重点在于定义关键的财务概念。我们介绍了：

商业模式：批发烘焙咖啡的基本运作方式。
成本分类：区分了可变成本（如生豆、燃料）和固定成本（如折旧、租金）。
重要会计概念：包括折旧（特别是直线折旧法）、损益确认以及应收账款。
核心风险点：揭示了即使账面盈利，由于付款周期（货到付款 vs 净60天）导致的负浮存金可能带来严重的现金流风险。

我们明确了利润（体现在损益表中）和现金流（体现在现金流量表中）是截然不同的两个分析维度。在下一部分，我们将运用这些概念，具体分析在不同销售增长情景下，埃格斯烘焙咖啡将面临的现金流挑战。

007：盈利增长企业如何陷入困境 💸

在本节课中，我们将通过埃格斯烘焙咖啡的案例，深入探讨一个看似盈利且快速成长的公司是如何陷入财务困境甚至破产的。我们将分析两种不同的销售情景，重点关注利润表与现金流量表之间的关键差异。

上一节我们介绍了案例的基本背景，本节中我们来看看具体的情景分析。

情景一：稳定销售 📊

首先，我们分析销售保持稳定的情景。埃格斯烘焙咖啡每月稳定销售 25，000 磅咖啡，每磅售价 6**，平均总成本为 **5，因此每磅净利润为 1**。以下是情景一的财务细节： * **利润表**：一月份的销售额为 **150，000（25，000磅 × 6/磅）。一月份的生产变动成本为 **100，000（25，000磅 × 4/磅），加上固定成本分摊 **25，000（10，000管理费用 + 15，000设备折旧）。最终，一月份净利润为 25，000**（150，000 - 125，000）。 * **现金流量表**：情况则截然不同。一月份，为生产和烘焙25，000磅咖啡豆，我们需要立即支付 **110，000 现金（100，000变动成本 + 10，000固定现金支出）。然而，一月份产生的 150，000** 应收账款，直到四月份才能收到现金。这意味着，在四月份第一笔现金流入之前，公司需要为二月和三月的订单额外支付 **220，000 现金。总计，公司在收到任何回款前，需要 330，000** 的现金储备。公司初始的 **260，000 现金储备显然不足，至少短缺 70，000**。假设能够及时借到这笔应急资金以维持三月份的采购，现金流将在四月份转为正数，净流入 **40，000。但直到五月份才能开始偿还那笔 70，000** 的紧急借款。尽管现金流在四月转正，但直到公司启动后的第25个月（即第三年一月），才能完全收回最初的 **800，000 现金投资。到第一年年底，尽管账面上有 300，000** 的净利润，但手头的现金却比创业前少了 **510，000。

情景二：快速增长 🚀

接下来，我们考虑销售快速增长的情景。假设埃格斯咖啡大获成功，订单每季度翻倍：1-3月每月25，000磅，4-6月每月50，000磅，7-9月每月100，000磅，10-12月每月200，000磅，以此类推。

以下是快速增长带来的影响：

利润表表现优异：当四月份销量从25，000磅增至50，000磅时，利润不止翻倍，从 25，000** 增至 **75，000。这是因为固定成本（如管理费用和折旧）总额不变，分摊到更多产品上，导致单位成本下降，边际利润上升。这种现象被称为规模经济。其公式可以表示为： 单位成本 = 单位变动成本 + (总固定成本 / 总产量) 当产量（总产量）增加时，单位成本下降。到销售200，000磅时，单位总成本降至约 4.125**，单位利润升至约 **1.875。根据预测，第一年理论净利润高达 195万**。 * **现金流量表危机四伏**：然而，现金流量表描绘了一幅截然不同的图景。四月份，我们需要支出 **210，000 现金来生产50，000磅新订单，同时仅收到一月份25，000磅旧订单的 150，000** 回款，现金流依然为负。紧急借款额升至 **130，000。七月份，情况更糟：我们收到100，000磅的新订单，需要支出 410，000** 现金，而仅收到四月份50，000磅订单的 **300，000 回款，现金流缺口扩大。到九月底，紧急借款累计达到 580，000**。十月初，灾难降临。我们收到了每月200，000磅、持续三个月的新巨额订单。通过Excel模型预测现金流发现，要支撑到十二月底，总共需要 **210万现金，这意味着在初始投资之外，还需额外借款 121万**，这超出了筹资能力。由于无法支付货款，燃料被切断，工人离开，公司无法履行供应合同。买方不仅可能拒付之前的应收账款（如六月份100，000磅的 **600，000 货款），还会索要巨额违约金。公司唯一的销售渠道断裂，埃格斯烘焙咖啡宣告破产。

核心教训与总结 📝

本节课中我们一起学习了盈利公司可能破产的关键机制。核心教训在于：利润不等于现金流。即使每一笔交易在会计上都是盈利的（单位利润 > 0），但现金流入和流出的时间错配（即“负浮差”问题）可能耗尽企业所有现金储备。快速增长会加剧这一问题，因为它需要更多的营运资金来预付成本，而回款却有延迟。

如果提前认识到这个问题，企业可以尝试安排应收账款融资或保理（以应收账款为抵押的短期贷款）来缓解现金流压力。然而，这需要时间筹划，当危机突然降临时往往为时已晚。

因此，对于创业者和管理者而言，密切监控现金流量表，而不仅仅是利润表，并提前规划增长所需的资金，是确保企业长期生存的至关重要的一环。

008：传统企业销售漏斗 📊

在本节课中，我们将要学习传统企业销售漏斗。我们将了解其构成阶段、关键指标，以及如何追踪这些指标来衡量销售团队的成功与否。

上一节我们介绍了收入指标是面向外部的，衡量公司识别潜在客户、沟通价值主张并最终达成销售的能力。本节中，我们来看看一个具体的框架——传统企业销售漏斗。

什么是企业销售？

在本课程中，我们宽泛地使用“企业销售”这一术语，指代任何需要公司全职销售人员参与的销售。历史上，企业销售指的是复杂产品或服务的大额销售，例如一台大型资本设备（如风力涡轮机），或通过竞标流程赢得作为办公楼建设项目总承包商的权利。

企业销售至少需要与潜在客户进行电话沟通，了解他们，更重要的是让他们有机会了解你。因此，这几乎总是需要派遣你的人员或你自己前往客户所在地进行面对面会议，有时在达成销售前需要多次会议。

企业销售成本高昂。因此，每笔企业销售的回报必须足够大。试图对低价或中价商品进行企业销售的公司，通常平均每笔销售都会亏损，最终要么改变销售模式，要么倒闭。

不同行业、不同公司对于构成最小规模企业销售的金额有不同的标准。但根据美国的运营成本，我可以给出一个通用规则：对于一次性销售，你希望最低金额达到 250,000**；对于周期性销售，每年最低金额达到 **100,000，才能证明企业销售工作的合理性。

销售漏斗指标详解

销售漏斗描述了潜在客户从初次接触到最终成交的转化过程。以下是其关键阶段和指标。

1. 线索

线索是指你拥有其姓名和联系信息的人，并且你知道他在一家拥有相关需求（例如拥有送货卡车）的公司工作，因此他们未来可能有购买需求。

2. 合格线索

第一步是鉴定线索是否合格。定义可能有所不同，但我认为，要成为一个合格线索，你的销售团队需要确认两件事：

第一，线索所在的目标公司计划在未来一年内从某处购买至少两到三辆送货货车。
第二，如果他们想买，他们有能力购买你的货车。换句话说，他们有购买计划，并且有预算购买你价格区间的货车。

提示：许多人乐于在电话上花几个小时谈论他们的公司多么想购买你正在制造的产品，但你可能在数月或数年后才发现，他们的预算中根本没有钱购买任何此类东西。这类人也常常喜欢邀请你自费前往进行产品演示，却不告诉你现场不会有任何有购买决策权的人。

请注意，你是根据目标公司的计划和预算来确认线索合格的。现在，你需要确定目标公司组织内拥有预算和决策权来决定购买的人。他们需要能够签署采购订单。他们是正确的决策者。

3. 意向表达

当正确的决策者告诉你，他们有兴趣与你探讨购买你产品的可能性时（例如，“是的，我们可能会从你这里购买货车”），这就是一个意向表达。

4. 与决策者会面

下一个重要步骤是直接与正确的决策者会面。在大型、复杂的组织中，这可能需要首先与其他人进行多次会议，包括各种“看门人”和低级职能人员，以及大量的文件要求。优秀的销售人员似乎有一种诀窍，能直接找到最高负责人，绕过可能无休止的会议过程。

5. 软性成交

一旦决策者被说服，你克服了他们所有的反对意见，解决了他们所有的顾虑，并协商好了条款和价格，他们直接告诉你他们的公司将以Y美元的价格从你这里购买X数量的货车，你就得到了我所说的“软性成交”。

为什么称之为“软性”？因为在与实际签订具有法律约束力的合同完成交易（更不用说收到付款）之前，仍然可能出错的环节数量多得惊人。以下是我职业生涯中遇到过的一些例子：

决策者不再接听你的电话，停止回复你的电子邮件，假装你不存在。
决策者辞职、被解雇或调往其他部门，你需要与一个从未听说过你或你产品的新人重新开始销售流程。
目标公司突然被收购，或正在进行收购谈判，所有待定合同被无限期暂停。
目标公司破产。
你自己的公司决定停止生产或提供你刚刚销售出去的产品或服务，但只在客户同意后才告诉你这个决定。

6. 正式合同销售

这是指签订了具有法律约束力的正式合同销售。此时，你才能在财务会计目的上确认收入。

总结

本节课中，我们一起学习了传统企业销售漏斗的完整流程。关键的企业销售指标依次是：

新线索
新合格线索
意向表达
与正确决策者的会议
决策者同意（软性成交）
实际的正式合同销售数量

理解并追踪这些指标，对于评估销售团队效率、预测收入以及优化销售策略至关重要。

009：亚马逊作为动态指标应用的领先范例（第一部分）📊

在本节课中，我们将学习动态收入指标的概念，并以亚马逊公司作为核心案例，深入探讨其如何通过数据分析和实时定制来优化客户体验与销售收入。

销售活动存在于一个连续光谱之上。光谱的一端是企业销售，其依赖于销售人员与潜在客户之间一对一的个人会议。这类销售代表了销售连续体中的一个极端。

在这个极端，传统的收入指标占据主导地位。而在光谱的另一端，在线零售商则完全无需人工互动，就能吸引潜在客户完成购买。

然而，成功的在线零售商通过其网站或移动端界面管理客户体验，使得销售过程不会显得非人性化或机械化。并且，它们基于实证数据来管理这一过程，以优化每位客户访问带来的收入。

接下来，我们将详细研究一家在定义和利用动态收入指标方面做得非常出色的公司——亚马逊（）——的客户体验及相关指标。

如果你的公司从事零售业，亚马逊方法中的某些方面无疑可以作为当前的最佳实践来应用。即使你不在零售业，亚马逊用于研究访客点击流数据（即点击、光标移动、页面间跳转的模式）的方法，也是适用于任何拥有网站的企业的重要数据分析方法。

亚马逊底层计算机系统设计的精妙之处在于，它能够无缝地将用户看到的、来自各种数据库和索引的大量预处理数据，与对用户查询和点击活动的实时响应结合起来。实时定制意味着公司可以在用户会话进行时，基于该用户的历史和当前点击流数据，以及该访客和类似访客过去的详细行为记录，为每个个体定制用户体验。这是我们实现“立即改变业务流程”这一总体目标的最高体现。

我想通过一个例子，带你深入了解我本人在亚马逊上进行的一次图书搜索，解释亚马逊过去必须做哪些工作，以及它被设计成如何在实时中支持当前的用户体验。

我将从图书的文本搜索开始，输入三个词：information， theory， learning。

在三秒内，亚马逊向我展示了一个包含12本可见图书的网页。让我带你了解这个网页，以及亚马逊选择展示给我的这12本特定图书的列表是如何生成的。

亚马逊维护着一个非常庞大的数据库，我们称之为图书ID数据库。

其中，每一本销售的图书都被分配一个独立的记录号和由唯一图书ID指定的位置。

亚马逊还维护着一个最新的文本索引，以便文本搜索中的每个词都能用来精确检索数据库中标题包含该词的图书记录。

有时，书内的文本也可能被索引。

对于我的搜索，亚马逊在其数据库中识别出超过1200本图书，这些书的标题或其他索引文本中至少包含我的三个搜索词中的一个。现在，有趣的部分开始了。

亚马逊本可以从1200本书中随机挑选12本，那样的话，这些书几乎肯定不是我想要的。我可能会向下滚动，再看一两页，浏览大量无关的内容后，最终放弃购买。这就像是1995年左右的互联网搜索。

相反，亚马逊开始应用其自身的动态收入指标。亚马逊根据这1200个可能相关的项目对我的预测相关性进行排名。换句话说，它们按照输入我的搜索词的人本次访问会购买该商品的概率进行排序。它们只向我展示1200本书中排名前12的，即亚马逊先前数据分析预测我最有可能购买的。这非常酷。

我推断，尽管我没有亚马逊系统的直接内部知识，但亚马逊在选择展示给我的图书时，使用了一个两步流程。

第一步，它们分析我的三个词文本字符串“information, theory, learning”，并将其与一个预定义的高级主题领域类别列表进行匹配。这种类别列表就是老式图书馆卡片目录中的主题索引。由于主题索引包含的词汇量比人们可能查询的所有词汇要少得多或更受控，因此这类索引被称为受控词汇索引。

亚马逊在我输入的文本字符串与其受控词汇索引之间进行匹配。它们通过使用一个庞大的同义词库来实现，该词库为我输入的词汇在其主题领域索引中找到最佳的同义词。这是一种非常有效的方法，可以为人们找到他们实际想要但不知如何询问的东西，而不是给他们自认为想要但会失望的东西。

我之所以推断亚马逊在幕后进行了这种同义词匹配，是因为亚马逊决定向我展示为最相关的主题领域名称。它们出现在第一页的左上角，并附有亚马逊目录中交叉列在每个主题领域下的图书数量。

值得注意的是，虽然所有10个主题领域都与我相关，但其中只有3个主题领域包含了我原始查询中键入的任何一个词。

高级主题索引还可以扩展以包含子主题。例如，如果我点击“AI and machine learning”，我会得到AI and machine learning, computer vision, pattern recognition, intelligence and semantics, neural networks, machine theory等子类。

如果我们有一个类别和子类别的树状结构，亚马逊通过一本书相对于同一主题领域子类别下其他图书的销售情况来定义畅销书。

我提到过，我怀疑亚马逊在选择向我展示哪12本书时采用了两步流程。第一步是使用同义词库来检索亚马逊自身主题索引中最相关的类别。第二步则涉及识别我的搜索词最匹配的主题子类别内的畅销书。正是这些根据主题相关性加权的畅销书，被亚马逊展示给我。

对于亚马逊来说，识别主题类别这个中间步骤是必要的，因为如果它们只是不考虑子类别，按销售率对所有1200本书进行排名，那么任何我（可能只有几千其他人）感兴趣的专门书籍，都会被最畅销的大众读物所淹没。

因此，我们可以推断亚马逊正在使用的动态核心指标是：

在受控词汇索引中，哪些主题领域类别与用户键入的精确查询词最相关？
在最符合其查询的主题子类别中，哪些书籍是我们当前销售最多的？

本节课中，我们一起学习了销售连续体的概念，并以亚马逊为例，深入探讨了其如何通过构建图书ID数据库、文本索引和受控词汇主题索引，并应用两步流程（同义词匹配与子类别内畅销书排名）来实现实时定制和动态收入优化。这种基于点击流数据和历史行为分析的方法，是提升在线业务收入能力的强大范例。

010：亚马逊动态收入指标解析（第二部分）🔍

在本节课中，我们将深入探讨亚马逊如何利用动态收入指标来优化其推荐系统。我们将重点关注“共同购买”和“共同浏览”数据，了解亚马逊如何存储、分析并运用这些信息来最大化销售潜力。

上一节我们介绍了亚马逊如何为每本书存储分类和销售排名数据。本节中，我们来看看亚马逊还为每本书追踪了哪些其他动态收入指标，以及它如何存储和使用这些信息。

共同购买数据：揭示关联销售模式

当用户点击一本具体的书（例如 David McKay 的《信息论、推理与学习算法》）时，亚马逊会展示一个“经常一起购买”的推荐区域。这揭示了亚马逊追踪的一个关键动态指标：共同购买数据。

以下是亚马逊追踪共同购买数据的关键点：

亚马逊记录每一笔同时购买多本书的交易。
它为销售的每一本书维护一个实时更新的数据库，记录在同一用户会话中、由同一客户ID购买的其他书籍。
这种数据被称为共现数据，可以用共现矩阵来表示。

一个随之而来的问题是：亚马逊展示的“经常一起购买”的书籍列表，是否严格按照共现频率从高到低排序？答案可能并非如此。亚马逊很可能通过A/B测试来优化这个展示位置，以最大化销售额或利润。它可能展示的是能带来最佳追加销售收入的书籍，而非严格意义上共现频率最高的书籍。

共同浏览数据：捕捉未完成的购买意向

除了追踪用户同时购买了哪些书，亚马逊还维护着一个关于用户浏览行为的共现数据库。

以下是亚马逊利用浏览数据的方式：

亚马逊记录用户在浏览过程中点击查看过的每一本书，即使最终没有购买。
在商品页面底部，亚马逊会有一个单独的列表，展示用户在浏览了当前书籍（但未购买）的同一会话中，最常购买的其他书籍。
通过这第二组记录，亚马逊可以识别出那些浏览了某本书但未购买的用户，最终购买了哪些其他书籍。

亚马逊的三层推荐逻辑

综上所述，亚马逊的推荐系统主要基于三层动态指标：

第一层：利润最大化的“经常一起购买”指标。这是最直接的促销手段，旨在提高单次交易的价值。
第二层：基于购买的推荐引擎。假设用户会购买当前查看的书籍，系统会推荐其他可能被一起购买的书籍。
第三层：基于替代购买的推荐。基于那些浏览了当前书籍但未购买的用户，最终购买了哪些其他书籍的数据进行推荐。

本节课中我们一起学习了亚马逊如何利用“共同购买”和“共同浏览”这两类动态收入指标来构建其强大的推荐系统。我们了解到，这些数据被结构化为共现矩阵，并通过A/B测试不断优化展示策略，其最终目的都是为了精准预测用户行为并最大化销售收入。

011：库存管理 📊

在本节课中，我们将学习用于评估公司库存管理效率的关键指标。库存管理是企业在不降低产品质量的前提下，降低成本、最大化利润的主要方式之一。我们将了解库存的定义、为何需要最小化库存时间，并学习如何计算和分析库存周转天数。

上一节我们介绍了企业销售相关的收入指标，本节中我们来看看盈利能力和效率指标，特别是广泛用于评估公司库存管理效率的指标。同时，我们还将揭示如何以最低价格预订酒店客房的秘密。

为何关注库存管理？🤔

库存管理是运营公司降低成本、最大化盈利能力的主要途径之一，且无需以任何方式降低所售商品的质量。

定义库存 📦

库存通常指等待被购买的成品，通常存放在零售店的货架上，或位于工厂与客户之间的物流仓库中。

产品从制造到售出之间闲置的时间越长，对制造商而言效率就越低。库存时间会侵蚀利润。

以下是需要最小化库存时间的四个主要原因。

负现金流：你应该从“Eggs Roast Coffee”案例研究中熟悉这个问题。向零售商供货的制造商通常要等到商品在零售端售出后才能收到货款，但生产该产品的资金已经支出。这种负现金流需要营运资金，也意味着利息支出。负现金流的时间越长，支付的利息就越多。如果公司信用不佳，且负现金流意外增加，它可能会在等待库存售出的过程中耗尽现金。

例如，零售服装店尤其容易因店内未售出库存导致的现金流问题而被迫破产。在美国，仅2015年前六个月，就有三家大型零售连锁店（Wet Seal、Cache 和 Simply Fashion）宣布破产。

固定的仓储成本：每天为仓库或零售店供暖、照明、空调、支付租金、安保及其他维护都需要成本。产品在货架上存放的时间越长，需要分摊给它的仓储成本就越高。

例如，假设一个家具仓库和展厅的固定成本为每年10万美元，它有空间展示200套完全组装好的豪华餐桌。这些餐桌的平均售价为1200美元。如果平均库存周转率为每年一次，则意味着我们每年将售出200张桌子，我们需要将10万美元分摊到这200个单位上，即每张桌子500美元的仓储成本。如果平均库存周转率为每年五次，那么我们只需要为每张桌子分摊100美元，这看起来更合理。

损耗：平均而言，库存物品在库存中存放的时间越长，其价值就越低。有些库存物品会完全损耗。如果它们没有立即售出，其价值会降至0。考虑新鲜烘焙的面包或必须在制作当天售出的餐厅食物。这些都是极端例子，其中每单位未售出的额外库存都是完全损失。库存损耗的其他例子包括任何有保质期的产品。在美国和其他国家，许多杂货商品都有规定的“销售截止日期”，超过此日期则依法不得销售。我们稍后将单独考虑的一种特殊完全损耗情况是酒店客房和航空公司座位。如果它们在“过期日”之前没有售出，其作为库存的价值将变为零。
过时：在库存中存放六个月或更长时间的物品，实际上可能是永远没有人想再购买的东西。可能是该产品的产量超过了全球需求，或者产品已经过时并被更好的产品取代。或者时尚已经改变。物品在库存中存放的时间越长，其最终需要在不销售的情况下被处置、造成完全损失的风险就越大。

库存周转天数 📅

基于上述原因，平均库存持有天数（缩写为“库存天数”）是一个非常有用的业务跟踪指标。

然而，没有多少公司愿意公开其库存天数数据。不过，我将与您分享一个便捷的技巧，用于根据上市公司必须在年度报告中包含的数字来估算其库存天数。

上市公司年度报告将包括年末库存价值以及年度销售成本总额。库存价值使用与评估销售成本相同的会计方法，因此这是同类比较。公司年末库存除以年度销售成本总额，再乘以一年的天数（365），就是对平均库存天数的很好估计。

公式： 库存天数 ≈ (年末库存价值 / 年度销售成本) × 365

我们将以沃尔玛为例进行计算，数据来源于（一个拥有优秀商业指标术语表的网站）。

截至2014年1月的财年，沃尔玛年报给出年末库存为449亿美元，年度销售成本为3581亿美元。

沃尔玛该年度的估计库存周转天数计算如下：44.9除以358.1，等于0.125，再乘以365，结果约为46天。沃尔玛平均在46天内售出其所有库存，考虑到每家沃尔玛需要备货的滞销商品数量，这相当令人印象深刻。一家沃尔玛商店通常备有超过10万个不同的产品SKU。

深入分析：SKU级别的动态跟踪 🔍

库存天数指标很好，但它没有告诉我们成千上万种商品中，哪些没有按预期速度销售以及原因。

可能是特定产品具有季节性、不再流行、或因有缺陷被客户退回。这些都是我们希望立即了解的动态指标。

所有拥抱大数据文化的公司（包括美国主要的零售杂货连锁店，如沃尔玛、7-11、好市多等）都在单个产品SKU级别跟踪库存周转和库存天数。

他们进一步按国家地理区域甚至单个商店细分该分析。这是通过跟踪本地管理层重新订购任何商品的日期和数量（通常还包括商品上架时间）来实现的，并与收银台销售数据（记录所有销售的确切时间和SKU）进行比较。

例如，如果北卡罗来纳州的一家商店每年销售50把雪铲，且所有销售都发生在12月至3月之间，那么让他们在4月至11月期间持有雪铲库存是没有意义的。

在最佳实践系统中，每个产品SKU都有其自己预期的库存天数，并根据地区和季节性因素使用数学模型进行调整，这有助于确定应为其分配多少货架空间。任何时候发现实际库存天数与预期不同，这就是一个需要关注的警告信号。

另一个问题是货架上某商品数量太少。我们无法直接测量有多少次潜在客户因为想要的商品缺货而不高兴地空手离开，但一个衡量“空手而归的流失客户”的好代理指标是任何特定SKU的库存达到零的次数。从品牌声誉的角度来看，手头至少备有一件你可能预期会销售的商品是非常可取的。

正如彭博社记者梅根·麦卡德尔在2013年的一篇文章中所说：“沃尔玛曾试图削减其承载的SKU数量，但最终不得不将它们重新上架，因为这导致了投诉和销售损失。”产品的单位销售量越高，每次我们看到零库存时潜在的营收损失就越大。一个极好的做法是，每当观察到潜在客户空手离开大型零售店时，派一位友好的市场研究员手持5美元礼品券追上他们，并询问：“您今天有没有在找某样我们货架上没有的商品？”事实上，我注意到昨天在我当地的杂货店（一家大型全国连锁店的一部分），员工现在接受培训，在结账时会问：“今天有什么东西您没找到吗？”我每次都想回答“是的，鸸鹋蛋”，希望某个数据分析师会决定他们应该储备鸸鹋蛋。您也可以试试。

总结 📝

本节课中我们一起学习了库存管理的关键效率指标。我们了解到库存持有时间过长会因负现金流、固定仓储成本、损耗和过时而侵蚀利润。库存周转天数是一个核心指标，可以通过(年末库存 / 销售成本) × 365来估算。更重要的是，现代企业需要在单个SKU级别动态跟踪库存，考虑地区和季节性因素，并警惕库存异常（过高或为零），以优化库存水平、减少损失并提升客户满意度。高效的库存管理是提升企业盈利能力的关键杠杆。

012：酒店客房入住率优化 🏨

在本节课中，我们将要学习如何将商业分析应用于酒店业，通过优化客房入住率来提升盈利能力。我们将探讨酒店客房作为一种“易逝资产”的特性，并学习如何利用数据分析来制定动态定价策略。

并非所有库存中的易逝资产都是传统意义上摆在货架上的产品。两个重要的例子是机票和酒店客房。以下是为何可以将它们视为完全易逝资产的原因。

航空公司有定期航班，例如从罗利-达勒姆机场飞往旧金山。如果航空公司填满那个座位，其最低可变成本仅仅是额外燃料，用于承载可能增加的约100公斤乘客及其行李，或许还有一瓶水和一些花生。与该座位相关的几乎所有成本都是固定成本或沉没成本。航空公司不能因为航班上有一个空座位，就在飞机租赁、维护或支付飞行员和机组人员工资上减少开支。如果座位没有及时售出，创造该座位的资金就完全浪费了。

类似地，在任何给定的夜晚，一间未被租出的酒店客房对酒店所有者来说都代表着一个失去的机会。租出一间房的变动成本非常低，主要是提供干净床单和一小瓶洗发水的成本。使该酒店客房可供使用的几乎所有成本都是不可收回的固定成本，即沉没成本。

今年六月，我为了参加Coursera的一个研讨会，在森尼维尔的格兰德酒店从周六住到周五晚上。我被告知，同一间客房在一周中每晚的价格都不同。这就是可变定价。

上一节我们了解了酒店客房作为易逝资产的特性，本节中我们来看看酒店如何制定其可变定价策略。答案当然是商业分析。我们将看一个将商业分析应用于入住率指标的简化模型。

假设一家酒店在过去两年里，每晚对所有基础客房收取固定的150美元房价。查看过去两年的数据，该酒店的入住率略高于平均水平，为66.4%（这些数字是我虚构的。美国酒店的平均入住率在2013年和2014年分别为62.3%和64.4%）。到目前为止，这没什么用。

然而，如果我们按星期几重新计算平均入住率，会看到以下模式。

以下是按星期几划分的入住率数据：

周一：85%
周二：90%
周三：95%
周四：88%
周五：45%
周六：30%
周日：40%

显然，在工作日有更多人前往该酒店旅行，周三是高峰日，而周六和周日的旅行者则少得多。商务旅行者希望周末和节假日在家。这告诉我们这主要是一家商务酒店。

我们可以从这些周度数据推断，如果我们对周一、周二和周四收取稍低的价格，对周五、周六和周日的客房收取更低得多的价格，或许能够提高整体入住率。

上一节我们发现了入住率的周度模式，本节中我们进一步深入，看看周三的特殊情况。如果我们更深入地研究周三的入住率数据，会发现除了周度模式外，还存在季节性模式。

例如，感恩节前的那个周三，入住率可能是35%。圣诞节后那一周的周三，只有40%。而八月的周三，入住率可能达到75%。我们假设平均周三入住率是95%，而九月、十月、三月和四月的周三入住率是100%，这意味着酒店在这些月份的周三完全售罄。

因此，我们正在拒绝数量未知的客人。在九月、十月、三月和四月的周三，我们的需求超过了供应。虽然不清楚需求超过供应的具体程度，但很明显，我们在那些夜晚的收费可能低于我们能够收取的价格。

所以，我们对周三的策略可能是根据一年中的时间收取三种不同的价格：对节假日和八月的周三收取低于150美元的价格；对大多数周三保持150美元；对四个商务旅行高峰月的周三收取高于150美元的价格。

那么，我们应该提高或降低多少价格呢？这就进入了权衡价格与需求的复杂模型领域。这些模型的最佳基础是经验性的：尝试不同的价格，观察房间是卖得太慢还是太快。

以下是实现此目的的一种方法：在在线旅行社（OTA）网站上列出批量客房。OTA对酒店来说并非理想选择，因为它们会收取客房价格10%到25%的佣金，因此酒店更愿意直接向消费者销售。

然而，一个典型的策略是：将特定夜晚的一批客房以预先商定的价格分配给一个OTA。如果OTA未能全部售出，未售出的房间将释放回酒店，由酒店尝试直接销售。OTA为酒店提供了一种机制，可以在不同日期测试不同价格，以观察该批客房是否以该价格售罄。

酒店在试验其公布价格或门市价（即未打折的客房价格）时面临一个挑战：即使是对价格不敏感的最后时刻商务旅客，这个价格也会成为新的最高价。

理想情况下，我们的酒店希望能够以较低的价格（甚至可以低至其理论上的盈亏平衡价格，即所谓的底价）提供一些房间，以吸引度假旅行者，同时为我们的商务旅行者保持较高的价格。

有一种方法可以实现这一点。给定客房的最低价格通常出现在所谓的不透明库存市场中。在不同时期，Expedia、Hotwire、Priceline、Kayak和Travelocity等都提供过此类服务。它们仅按价格提供某个城市的房间，可能也提供一些基本的评级类别信息（如酒店的星级），但不会透露酒店名称或任何其他可能让你识别出是哪家酒店的信息。

不透明库存市场的买家只有在购买完成后才知道他们将入住哪家酒店，并且所有购买都不可更改且不可退款。这种不确定性和不可更改性对商务旅行者没有吸引力。因此，这个市场使得酒店有可能在同一晚对同一房间保持至少两种不同的价格。

尽管关于不透明库存市场规模的确切统计数据很少，但我怀疑这个市场约占美国和加拿大酒店客房销售的2%到4%，并且可能没有增长。高档酒店不希望公开他们正在以比同一晚相同房间通常价格低30%到60%的价格出租一些房间。

此外，对酒店来说，不透明定价交易即使有利润，也往往微乎其微。价格往往接近所谓的底价，这是基于分配给每间房的固定成本加上一间房的变动成本，计算出的酒店每间房的盈亏平衡点的会计计算结果。

除了不透明定价，酒店可以也确实在使用各种模型，以介于门市价和底价之间的价格销售房间。例如，当酒店意识到有些房间可能无法售出时，他们可以向邮件列表或移动短信列表中的客户提供门市价的折扣，这些客户过去曾对该酒店或该品牌表现出一定的忠诚度。有一定品牌联系或品牌忠诚度的人会愿意支付高于不透明库存底价的价格。

那么，酒店何时应该以门市价的80%向忠诚客户提供房间呢？答案是：当房间在到期前以挂牌价租出的概率低于80%时。

总而言之，酒店客房通常每晚至少有三个潜在价格：门市价或挂牌价、底价，以及酒店可以在最后时刻向忠诚客户提供的中间促销价。只有底价是恒定的。挂牌价和促销价会根据星期几和一年中的季节而变化。因此，理论上，一家酒店在一年内可以以超过1000种不同的价格出租同一级别的房间。

本节课中我们一起学习了酒店客房作为易逝资产的特性，以及如何利用数据分析来制定动态定价策略以优化入住率。我们探讨了从固定定价到基于周度和季节性模式的可变定价的转变，介绍了门市价、底价和促销价的概念，并了解了不透明库存市场在价格区隔中的作用。通过应用这些商业分析技术，酒店可以更有效地管理需求，最大化收入潜力。

013：杠杆与声誉风险

在本节课中，我们将要学习两种关键的业务风险来源：杠杆风险和声誉风险。我们将了解高杠杆如何放大财务风险，以及声誉受损如何对企业造成长期影响。课程还将通过真实案例，展示如何利用数据来有效管理这些风险。

杠杆风险

上一节我们介绍了业务风险的常见类型，本节中我们来看看杠杆风险。最常见的业务风险似乎源于过度的杠杆。

当一家公司所欠的债务超过其自身价值时，它很可能无法生存。如果你身处一个依赖发放贷款的行业，并且自身也使用了高杠杆，那么客户违约给你带来的风险会被放大许多倍。

在美国2008年金融危机之前，银行被允许以每持有1美元的权益资本，借入33美元的资金。

设想一家银行能以2%的利率借款，并以3%的利率贷出。如果它拥有1000万美元的权益资本，它可以借入3.3亿美元的债务。以3%的利率贷出这些资金后，在扣除费用前，它每年能获得330万美元的毛利润，即其1000万美元权益资本的33%回报率。

然而，只需要其贷款中非常小的一部分变得无法收回或违约，就足以导致该银行资不抵债。1000万除以3.3亿仅为3%。

声誉风险

理解了财务杠杆的风险后，我们转向另一种同样重要的风险：声誉风险。声誉风险是指对你的品牌和未来销售能力造成的损害。

任何餐厅、连锁店、制造商或杂货零售商，在销售了受污染或变质、导致顾客生病的食品时，都极易受到负面宣传和声誉损害的影响。

以下是管理声誉风险的一个关键策略：

快速响应产品召回：在发生一级产品召回时，迅速联系所有潜在风险客户的能力至关重要。

风险管理案例：好市多（Costco）

为了更具体地理解风险管理，我们来看一个好市多（Costco）利用大数据进行产品召回的快速响应的成功案例。

好市多衡量其风险管理效率的一个指标是：当发生所谓的一级产品召回时，他们需要多长时间能联系到每一位潜在的风险客户。

因为好市多要求所有顾客购买年度会员资格，其会员数据库包含地址信息，通常还有电子邮件和手机号码。因此，好市多追踪客户相对容易。

这之所以容易，是因为好市多存储了每位顾客在单个产品ID或SKU级别上的每一笔购买记录。

这些数据被编入索引。当制造商发起产品召回时（如2014年春天发生的花生酱和桃子两次召回事件），好市多能在24小时内，识别出所有购买过该产品的5万多名顾客。

他们使用最快可用的方式联系这些顾客，在某些情况下通过电子邮件和电话，但无论如何都会向邮寄地址发送信件。他们因此成功阻止了许多人生病。

数据追踪溯源案例

一个更有趣的案例是利用好市多的数据库追踪流行病源头，此事发生在2010年1月至2月。

当时，美国44个不同的州有272人因感染同一种基因型沙门氏菌而生病。美国疾病控制与预防中心试图追踪污染源，但最初未能成功。

直到有人想到一个非常聪明的办法：分析这272人中可能曾在好市多购物的人的购买记录。由于好市多会员覆盖了约四分之一的美国家庭，可以合理推测这组人中约有70人是其会员。

随后，通过识别这70人共同购买过的食品，发现唯一共同的产品是意大利辣香肠。该产品由一家位于罗德岛州帕斯科的小型香肠公司——丹尼尔斯国际公司生产。

污染物最终被追溯到是来自纽约布鲁克林批发商“健康香料公司”的一个25磅重的碎红辣椒箱。事实证明，它并不那么“健康”。

本节课中我们一起学习了杠杆风险和声誉风险。我们了解到，高杠杆会显著放大财务脆弱性，而声誉损害则对企业的长期生存构成威胁。通过好市多的案例，我们看到完善的数据系统和快速的响应机制如何能有效管理产品召回风险，甚至帮助追踪公共健康问题的源头。这些工具和指标对于现代商业风险管理至关重要。

014：大数据背景下的角色与企业关联 📊

在本节课中，我们将探讨商业环境中人员如何与公司数据互动和协作。我们将介绍一个简化的角色分类框架，并分析不同类型公司与大数据的基本关系。理解这些内容有助于你明确职业方向，并评估所在公司的数据分析成熟度。

角色分类框架 👥

上一节我们学习了如何识别重要的商业指标。现在，我们将注意力转向商业人士与公司数据互动的主要方式。

我们提出了一个简化的框架，将主要角色分为四类，并对应四种不同的职位头衔。

以下是四种主要角色类型：

商业分析师
商业数据分析师
数据科学家
高级软件工程师或技术项目经理

本课程与职业角色的关联 🎯

接下来，我们解释本专项课程与这些角色的关联。

关联很简单。任何成功完成本专项课程的人，都将为担任商业分析师或商业数据分析师的初级职位做好充分准备。

数据科学家职位需要额外的技能和工作经验。但如果你有志于未来成为数据科学家，完成本专项课程后，你将清楚地了解需要采取哪些步骤来实现目标。除了少数拥有统计学、计算机科学及相关领域博士学位直接进入行业的人，大多数在职数据科学家都是几年前从商业数据分析师起步，并在工作中学习了所有额外所需的技能。美国也有许多优秀的硕士项目可以为你从事数据科学家职业做准备。

另一方面，高级软件工程师/项目经理的职业道路与商业分析师/数据科学家的职业道路截然不同，其培训和要求也大相径庭。我们将解释其原因，并讨论在优秀公司中，商业分析师、商业数据分析师、数据科学家和软件工程师如何合作与协作以取得卓越成果的最佳实践。

公司与大数据的关系 🏢

在考察了与数据相关的不同类型工作后，我们将思考数据在各类公司成功中扮演的角色。

我们根据公司与大数据的基本关系，将公司分为五种类型。

以下是五种公司类型：

专注于通用业务的战略咨询公司
所有行业中的传统实体公司
专注于信息技术或系统集成的战略咨询公司
销售用于收集、存储、分析和使用大数据的硬件、软件或软件即服务的公司
数字业务公司，其价值创造的核心涉及数据的实时分析

实体公司的数据分析成熟度 📈

在庞大的实体公司类别中，一些公司已经完全接纳了我称之为“大数据文化”所带来的机遇。

例如，在美国的杂货零售领域，好市多是运用数据分析最佳实践的优秀典范。而像Food Lion这样的公司则相对落后。还有像A&P这样的公司似乎不知从何开始，事实上，A&P现在已经破产。

因此，识别你的公司在采纳数据分析最佳实践的频谱上处于什么位置显然非常重要。我们将提供一些方法和工具，帮助你能够做到这一点。

我们还包含了一些简短的访谈，让你可以直接聆听目前在数据分析职业中蓬勃发展、但在不同类型公司中扮演多种不同角色的人们的经验。

总结 ✨

本节课中，我们一起学习了商业数据分析领域的四种关键角色及其与课程的关联，并了解了五类公司与大数据的不同关系模式。我们还认识到，即使在传统实体公司中，对数据分析的接纳程度也差异巨大，这直接影响其竞争力。理解这些框架有助于你规划职业路径，并评估企业利用数据驱动决策的能力。

015：业务分析师的核心技能 📊

在本节课中，我们将探讨业务分析师这一职位所需的核心技能。通过分析大量招聘广告，我们发现“业务分析师”这一头衔涵盖的工作范围非常广泛，职责要求也各不相同。我们将聚焦于所有这类职位共同要求的核心能力，并将其分解为七个关键领域。

概述

业务分析师需要将商业问题转化为可分析、可执行的方案。这要求他们不仅具备技术能力，还需理解业务本身。接下来，我们将逐一解析这七个核心技能领域。

核心技能详解

上一节我们概述了业务分析师角色的多样性，本节中我们来看看所有成功候选人都应具备的七项核心技能。

以下是业务分析师需要掌握的第一项核心技能：

识别关键业务指标的能力 这指的是对特定公司所在行业领域的深入了解。到目前为止，我们讨论的多是适用于许多行业的横向业务指标，例如企业销售漏斗。然而，许多指标只在特定的垂直市场或行业领域内才具有相关性。每个行业都有其专业指标以及通用指标，这些专业指标有其自身的概念和词汇。在本课程中，我们将涵盖几个主要垂直市场（包括房地产和金融服务）的行业特定指标。请记住，若想为其他垂直市场的业务分析师职位做准备，你需要对该行业特有的、衡量其成功、效率和风险的关键指标进行额外的行业特定研究。

在明确了需要分析哪些指标后，下一步就是如何分析它们。以下是业务分析师需要掌握的第二项核心技能：

应用合适模型分析指标的能力 业务分析师需要了解的模型可以在 Excel 中运行。本课程将涵盖跨多个行业使用的最重要的通用模型。值得花点时间澄清一下我们所说的“模型”是什么意思。模型是我们用简化的数学形式来代表现实世界情况的方式。例如，在银行整体信用卡违约风险的模型中，信用卡用户与卡片互动的全部行为（从总是按时全额还款，到有时错过最低还款额，再到严重拖欠但计划补上，乃至故意累积债务后消失）过于复杂。因此，一个模型可以将他们仅分为两类：违约和非违约。然后，我们可以利用历史模式来预测下个月有多少客户会从一类转移到另一类。这将是一个用于违约风险的二元分类模型。模型之所以有用，是因为它们比它们所代表的混乱现实更简单、更小巧，并且它们使用数学公式来代表现实，这使得修改模型、用于预测未来等变得容易。本课程的模型都可以在 Excel 中设置和执行。在课程二中，我们将深入讨论商业分析中最重要的模型。

建立了模型之后，我们需要评估其表现。以下是业务分析师需要掌握的第三项核心技能：

量化模型有效性的能力 不同类型的模型依赖不同的指标来衡量其表现。我们将研究所有最常用模型类型的标准性能衡量指标。例如，我们上面提到二元分类模型可用于预测未来的违约率。但进行二元分类的方法有很多种，选择我们可用的最佳方法（基于我们拥有的数据和其他限制条件）需要有一种公认的方式来比较所有二元分类模型之间的性能。正如我们稍后将看到的，有一个通用指标可以比较任意两个二元分类：ROC曲线下面积。关于此的更多细节将在课程二中介绍。

技术分析能力固然重要，但理解业务需求是分析的起点。以下是业务分析师需要掌握的第四项核心技能：

倾听与访谈的能力 这包括访谈客户（内部或外部）以定义项目需求。业务分析师的大部分工作成果以各种报告的形式呈现。一份报告可以是客户需求文档，将客户所述的需求转化为公司能够交付的产品功能和确切服务。或者，一份报告可能仅供内部使用，客户是营销副总裁或销售团队。一份有效的报告能够将问题“操作化”，它清晰地阐明了为解决该问题需要采取的具体步骤、由谁执行、按什么顺序执行。这些步骤随后可以被衡量和跟踪。我们将在本课程后续部分给出更多示例。

将需求转化为分析，离不开强大的工具支持。以下是业务分析师需要掌握的第五项核心技能：

Excel 技能

基础技能：包括识别业务数据中的模式和趋势、进行预测、组织财务信息以及在图表中展示结论的能力。
中级技能：例如导入和管理大型数据集、开发和测试不同模型以及使用规划求解运行优化的能力。这些主题将在课程二中深入讲解。

分析结果需要有效地传达给决策者。以下是业务分析师需要掌握的第六项核心技能：

演示技能 即使用 PowerPoint 进行有效、清晰、简洁且有说服力的口头和书面沟通。这个主题将在课程三中深入讲解。

最后，为了让非技术受众也能直观理解你的发现，可视化是关键。以下是业务分析师需要掌握的第七项核心技能：

使用数据可视化的能力 这能使你的结论和建议对非技术受众来说变得直观易懂。在本专项课程中，我们将教授商业领域最广泛使用的数据可视化工具之一 Tableau 的使用。同样，这个主题将在课程三中深入讲解。

总结

本节课中，我们一起学习了成为一名成功的业务分析师所需具备的七项核心技能：从识别行业特定指标、应用和分析模型，到倾听需求、运用 Excel 工具，再到通过演示和数据可视化清晰传达见解。这些技能共同构成了将数据转化为商业价值的完整链条，我们将在后续课程中对其中多项技能进行深入探讨。

016：业务分析师访谈

概述

在本节课中，我们将通过聆听商业分析师 Shambhavi Vashishtha 的分享，了解商业分析在实际企业环境中的应用。她将介绍其工作内容、使用的工具以及如何将学术知识转化为解决实际商业问题的能力。

现在，我想向你介绍 Shambhavi Vashishtha。

她在 Opera Solutions 公司担任商业分析师。大家好，我是 Shambhavi Vashishtha。

我目前在 Opera Solutions 担任商业分析师。

我在印度完成了数学硕士学位，随后在杜克大学获得了工程管理硕士学位。我修读过 Daniel Ager 教授的多门课程，并且非常喜欢它们。

我将谈谈如何将这些知识应用到我的职业生涯中。

Opera Solutions 是一家大数据分析公司，我们的客户遍布多个行业。

我们目前服务于旅游、医疗保健、零售、资本市场、私募股权等领域。

Opera Solutions 成立于 2004 年，至今已有 11 年。

公司已发展成为一家大型企业，在海外设有办事处，包括印度、上海、伦敦。在美国，我们在波士顿、纽约和圣地亚哥设有办公室。

目前仅在美国就有超过 500 名员工。

并且我们还在持续发展。作为一名商业分析师，我曾与不同行业的客户合作。

目前我正在与一家零售客户合作，这是一家财富 50 强公司。

我们致力于他们的个性化推荐项目。

可以想象，每个人都希望看到为自己定制的优惠。

我们正为此努力。

因此，我们会基于不同的分析准备不同的“故事”。

我们对数据进行各种图表和切分，然后将其放入 PowerPoint 幻灯片中。

围绕数据构建一个故事，然后呈现给客户。如果客户认可某个想法，我们就去执行它。

对于零售公司而言，客户忠诚度至关重要，因为公司希望维持客户的忠诚度。

公司希望客户反复光顾并完成交易。

这就是为什么公司希望每天都能优化客户的体验。

这就是为什么公司希望定制他们的购物体验。我们的衡量指标是：

我们希望增加他们的到店次数。

我们希望提高他们的购物篮价值，并从中提升我们的利润。

因此，你在购物时购物篮中的商品数量，我们希望提高这个数值。

我们希望你在零售店中探索不同的商品区域。

我们希望你能在我们这里花费更多，购买对你重要的商品。所以我们会向你发送与你相关的优惠。

商业分析师实际上在非技术人员和技术人员之间搭建了一座桥梁。

因为我需要向技术分析师解释非常技术性的分析，然后向客户解释分析结果，而后者必须完全是业务导向的，不涉及技术术语。

作为一名商业分析师，你需要面对不同的受众。我的受众包括我的业务客户，以及我的技术团队。

我需要向技术团队解释如何构建模型，以及我期望得到什么样的结果。

作为桥梁，我尝试用非常通俗的语言向业务人员解释，以便他们能够做出正确的决策，并拥有决策所需的所有信息。

当我们开始与这位客户合作时，我们收到了一个庞大的数据文件，必须对其进行清理。

我们所知并使用的不同清理流程包括文本匹配、去除空格、去除连字符，以及任何可能给数据带来干扰的内容。

之后，我们开始使用 SQL，具体是 MySQL 来运行所有查询，获取我们所需的数据。

一旦我从分析师那里获得干净的数据，我会将其导入 Excel。

我创建不同的图表和图形来分析机会所在。

一旦我们发现一些机会，就必须围绕它构建一个故事，并在 PowerPoint 中完成。

我们需要提出不同的数据点来支持我们的假设，即“如果你这样做，那将会发生”，然后用一些数据点、图表和图形来支持它。

然后将其呈现给客户。因为客户最了解自己的业务，如果方案合理，我们就执行。

一旦我获得干净数据，就将其放入 Excel。

Excel 是一个非常强大的工具，是大多数分析师的基本工具。

我在 Excel 中创建不同的数据切分、图形和图表来准备我的故事。

一旦我发现有突出的地方，就会深入分析，而 Excel 正是完成这项工作的工具，无论是数据透视表、VLOOKUP 还是其他任何功能，Excel 都能满足需求。

在职场中，你面对的是开放式问题，你并不清楚解决方案，因为需要你自己去构思。

数据挖掘课程为我做到了这一点。该课程让我们有机会探索不同类型的问题和解决问题的技巧。

然后提出多种解决方案，并可能作为一个团队找出最适合特定问题的那一个。

因为无论何时解决问题，你都是作为一个团队来完成的。

你的团队期望的是你能提出正确的问题，并朝着正确的方向前进。

我与优秀的同事共事，我们有一个很棒的团队。我有一个由统计学家和数学家组成的团队与我合作，他们会为我们构建实际的模型。

我会给他们一个业务需求，例如，我的需求是“我想分析我所有的客户，但逐个分析很困难，所以我希望对他们进行分群。”

是的，我会要求我的团队成员为我构建一个模型，该模型能输出不同的客户群组。

他们会根据客户的消费、行为、消费模式、购买内容、喜好、光顾频率等因素，将客户合并到不同的群组中。

这就是分群分析。这样你就不必在个体层面操作，而是可以将他们组合在一起，并提供与他们高度相关的内容。

总结

本节课中，我们一起学习了商业分析师 Shambhavi Vashishtha 的实际工作流程。她展示了如何从清理原始数据开始，使用 MySQL 进行查询，在 Excel 中进行深入分析和可视化，最终在 PowerPoint 中构建商业故事并呈现给客户。她的经历清晰地说明了商业分析师作为业务与技术之间桥梁的角色，以及如何运用数据分析技能解决真实的商业问题，例如通过客户分群模型（聚类分析）来实现个性化营销。

017：区分业务数据分析师与业务分析师角色 📊

在本节课中，我们将探讨业务数据分析师与业务分析师这两个角色的核心区别。我们将重点分析使业务数据分析师职位更具资深性、通常薪酬也更高的两项关键技能。

在许多方面，业务数据分析师的工作与业务分析师相似。业务分析师所需的所有技能，业务数据分析师同样需要具备。

然而，业务数据分析师角色与业务分析师角色主要在两个方面存在区别。正是这两项额外的要求或技能，使得业务数据分析师职位更为资深，且通常薪酬更高。

第一项区别：概念与分析技能 🔍

上一节我们提到了两者在技能要求上的重叠，本节中我们来看看第一项关键区别：概念与分析技能。

业务数据分析师需要具备灵活思考的能力，能够思考如何将公司当前收集的数据以新的方式进行重组和分析，从而更好地理解业务。

以下是两种角色的典型工作场景对比：

业务分析师：通常会被分配一个具体的问题进行分析，这些问题基于由他人整理好的信息。
业务数据分析师：可能需要能够从分散在公司各处的数据源中整合信息，并且应该能够判断在组织中的何处可以找到相关数据。

换句话说，业务数据分析师应该能够提出正确的问题，以识别出数据可能暗示的业务流程改进机会。

第二项区别：相关技术技能 💻

了解了概念技能的区别后，我们接下来看看与之相关的第二项关键区别：技术技能，特别是SQL的应用。

业务分析师通常会被给予一个现成的数据集或问题定义。而业务数据分析师则被期望能够运行SQL（结构化查询语言）查询，从庞大得多的数据库中提取有用的数据，甚至是从组织内多个地点分散的非结构化数据集合中提取。

以下是SQL技能带来的核心能力：

数据提取：使用类似 SELECT * FROM sales_data WHERE region = 'Asia'; 的查询语句从原始数据库中提取特定数据。
数据整合：将提取的数据组合成此前不存在的新数据集，以支持分析师的研究计划。

学习SQL并不困难。你可以在几周内掌握足够的SQL知识，以满足大多数业务数据分析师职位的期望。然而，这项技术知识确实构成了一道巨大的分水岭。

不具备SQL技能的人需要依赖他人（通常是组织内的IT部门或数据库管理员）来为他们创建可用的数据集。而拥有SQL技能的人则可以自行访问并重组组织内几乎任何原始数据。

这种自主性和自给自足的能力极大地提高了业务数据分析师的工作效率，并为他们提供了更大的创意空间。因为他们可以自行探索直觉或追踪线索，而无需麻烦其他员工来为他们收集、清洗或重组必要的数据。

本节课总结：我们一起学习了业务数据分析师与业务分析师的两个核心区别。第一是概念与分析技能，即主动利用现有数据发现新见解的能力；第二是SQL技术技能，它提供了数据访问的自主权，是提升工作效率和创造力的关键。掌握这两项技能是迈向资深业务数据分析师的重要步骤。

018：业务数据分析师Tiffany Yu访谈 💼

在本节课中，我们将通过业务数据分析师Tiffany Yu的访谈，了解数据分析在金融咨询行业的实际应用、所需的核心技能以及求职建议。她的分享将帮助我们连接课程理论与行业实践。

访谈对象介绍

现在，我想向你介绍Tiffany Yu，她是Argus信息与咨询服务公司的业务数据分析师。

我的名字是Tiffany。我来自中国上海附近的一个城市。大约四年前，我来到杜克大学攻读工程管理硕士学位。在那期间，我参加了由您指导的Roman国际贸易竞赛，那是一段非常棒的经历。同时，我也选修了由您开设的数据挖掘课程。

毕业后，我加入了Argus信息与咨询服务公司。这是一家咨询公司，为美国、英国、加拿大信用卡行业的领先零售银行、信用机构和零售商提供营销分析、数据分析和风险管理服务。我目前是建模团队的副经理。

工作内容与数据应用

上一节我们认识了Tiffany，本节中我们来看看她的具体工作内容以及如何应用数据。

我们拥有信用卡交易级别的数据。这意味着，例如，每次你在杂货店刷信用卡时，我们都能捕获消费金额、交易描述和交易时间。客户希望了解客户的违约率、潜在的违约风险。然后，我们可以使用一个逻辑回归模型来预测该客户违约的可能性有多大。

因此，我们帮助他们处理这类营销活动、现有客户管理、市场拓展活动以及一些风险管理项目。说实话，由于我们拥有独特的数据，我们在市场上并没有真正的竞争对手。

面试考察与技能要求

了解了日常工作后，我们来看看这个行业在招聘时会考察哪些能力。

通常在面试中，他们会给你一个案例，类似于一个商业案例。然后他们会问你想要建立什么样的模型。此外，在你建立模型之后，你会使用什么样的指标来评估这个模型是否有效。同时，如果你建立了这个模型，这个模型会存在什么样的偏差。最后，你如何使用模型结果回过头来解释业务问题。

我的日常工作涉及使用SQL、Excel这类工具。如果只学一门语言，那绝对是SQL。是的，它非常非常有帮助。它就像一切的基础。因为通常在大数据领域，你必须有一个地方来存储所有那些数据。而你首先需要做的事情就是从数据库中收集数据。所以我认为SQL会非常非常有帮助。

关键指标与职业角色澄清

在掌握了基础工具技能后，理解业务指标和明确职业定位同样重要。

我们建立模型为他们预测，在信用卡行业中我们称之为“响应率”。关键的指标包括总消费额、总余额、平均信用额度等。

实际上，现在有很多职位名称，比如业务分析师、数据分析师和数据科学家，人们常常对它们到底是什么感到困惑。很多人去申请这些职位，然后在面试前一两天打电话问我需要知道哪些技能。我说，如果你会写SQL语言会很好。他们就会说，哦，你应该早点告诉我。这并不那么难。我的意思是，如果人们准备大约一周，他们实际上可以掌握一些东西。但大多数时候，我只是觉得人们并不真正了解，并且他们无法获得这类信息。

总结与建议

本节课中，我们一起学习了业务数据分析师Tiffany Yu的行业洞见。

因此，我认为开设像这样的课程真的很有帮助，能够从实际在这个行业工作的人那里获得信息，告诉你需要了解哪些技术技能。同时，也指导你在解释以往工作经历时，应该如何呈现它。

019：数据科学家 👨‍🔬

概述

在本节课中，我们将要学习数据科学家这一新兴的领导角色。我们将了解其定义、重要性、核心职责，以及成为一名数据科学家所需掌握的、超越商业数据分析师的额外技能。

什么是数据科学家？

数据科学家是一个新兴的领导角色。这一角色具有跨学科性质，其职责范围在不断演变。尽管如此，数据科学家正日益被视为至关重要的职位。目前，市场对熟练数据科学家的需求远远大于供给。

在过去十年中，很难想象任何有竞争力的、追求规模化的企业，能够在没有协调一致地整合以下三个要素的情况下，在其市场中生存，更不用说发展和取胜了。

数据科学家的核心职责

数据科学家的核心职责是协调整合以下三个关键要素，以支持企业决策。

1. 建模、机器学习与预测 这指的是利用模型、机器学习算法进行预测分析的环境。

2. 数据驱动的业务流程 这指的是一个关键业务流程数据被持续捕获、存储、分析，并在整个组织内更新和共享的环境。

3. 实时或准时的决策支持 最后，数据需要以实时或准时的方式传递给决策者。

在许多情况下，决策者本身就是一个计算机算法，它无需人工输入即可实时决定如何与客户互动，就像我们之前讨论过的亚马逊推荐引擎一样。这需要对用户体验设计过程产生重大影响，并需要投入更多的软件工程资源。

在其他情况下，需要将客户最近的交易信息提供给销售或支持人员，以便他们在与客户联系时，了解迄今为止发生的一切。准时的标准就足够了，但这同样需要付出巨大努力来设计、构建和维护公司的数据存储与检索系统。

无论在哪种情况下，数据科学家都是那些能够把握大数据在显著改进业务流程方面的可能性的人。他们能够将公司的业务目标和需求转化为数据库架构和软件工程术语，同时也能将工程师的需求和关注点转化为公司非技术管理层能够理解的语言。

超越商业数据分析师的技能要求

成为一名数据科学家的要求始于商业数据分析师所需的相同技能。但数据科学家还需要熟悉大量额外的技术和概念。数据科学家需要是宏观蓝图的大师，理解不同的工具和技术如何整合形成一个连贯的整体。

我们已经确定了数据科学家需要具备的、超越商业数据分析师九项技能的八个额外技能领域。以下是这八个技能领域的详细介绍：

1. 更高级的建模工具 至少对 R、Matlab 或 SAS 其中之一具备中高级知识。

2. 高级统计方法 大多数数据科学家至少在大学或在线课程中学习过一门微积分级别的概率与统计推断课程。本专项课程的第二课将介绍你在此类课程中会遇到的大部分高级主题，但以入门方式进行，以便你自己决定是否有兴趣深入学习这些主题。

3. 贝叶斯学习与概率模型 用于预测分析的机器学习算法。机器从数据中学习的方式，通过贝叶斯假设和贝叶斯方法得到了很好的体现。几乎所有实时决策系统都依赖机器学习来确保决策反映最新的数据输入。同样，第二课将简要介绍这些主题。

4. 额外的关系型数据库技能 至少包括如何填充（即向数据库中存入数据）和优化（使提取数据更快）SQL 数据库。

5. 关键通信技术的中级知识 了解用于在客户层（通常是网络浏览器或移动应用）和数据库层之间通信的最重要技术。这些工具是 Python、Java 和 JavaScript。

6. 管理分布式和非结构化数据的经验 包括 Hadoop、MapReduce、Hive、Pig 和 Spark 等工具。

7. 自然语言处理工具与方法的基础知识 用于情感分析等应用。

8. 大规模可扩展的云数据托管与处理经验 使用 Amazon Web Services (AWS) 或其最接近的竞争对手之一，如 Microsoft Azure 或 Google Compute Engine。

总结

本节课中，我们一起学习了数据科学家这一关键角色。我们了解到，数据科学家是连接业务需求与技术实现的桥梁，负责整合建模预测、数据流程和实时决策支持。要胜任这一职位，不仅需要具备商业数据分析师的核心技能，还需掌握从高级统计、机器学习算法到数据库优化、云计算等八大领域的扩展技能。这使其成为当今数据驱动商业环境中需求旺盛且至关重要的领导者。

020：数据科学家Dai Li访谈 🎤

在本节课中，我们将通过数据科学家Dai Li的访谈，了解数据科学家在实际工作中的角色、使用的工具以及如何将数据分析与商业决策相结合。本次访谈将为你揭示数据科学领域的真实工作场景。

访谈对象介绍

现在，我想向你介绍Dai Lee，他是ifV公司的一名数据科学家。

个人背景与公司简介

你好，我叫Dai。我目前在一家名为ifV的社交网络初创公司担任高级数据科学家。

公司大约有150名员工。它拥有几款社交相关的产品，包括、以及一款情感聊天应用can.not。

这是一家位于旧金山湾区（Bay Area）的公司。在我加入这家公司之前，我在杜克大学攻读工程管理硕士学位，主修数据分析方向。

数据来源与查询

我们公司的大部分数据是结构化的，存储在传统数据库中。我经常使用SQL来从数据库中查询数据。这包括例如，调用SELECT * FROM table_name;这样的语句。

此外，我们也有像Hadoop这样的分布式数据库。我们使用Hive，也使用Pig。我们目前也在探索Spark。

数据分析与工具

在我获取数据之后，就进入了第二步：数据分析。我使用R、Python、Matlab、Octave、Becca等工具，选择最适合我手头问题的可用工具。

市场上还有其他可用的工具，例如SAS。当然，我也使用Excel。听起来Excel可能更偏向非技术性，但实际上它是一个非常好的工具，你可以用Excel以很高的效率完成大量的数据处理、数据分析和数据建模工作。

脚本与工程任务

脚本编写在某种程度上与工程更相关，我通常使用脚本语言来执行一些数据ETL任务，其中ETL代表提取（Extract）、转换（Transform）和加载（Load）。

同时，我也使用脚本任务进行大量的文本处理和与文本相关的建模。我经常使用Python来做这些工作。

数据可视化与工具开发

我使用R，特别是它的Shiny包，来构建一些数据分析工具。我尝试抓取并处理数据，然后将感兴趣的数据展示给我的客户，这些客户很可能是数据分析师或产品经理，他们希望了解公司或特定产品的情况。

并通过工具展示数据的可视化结果。

与业务结合

我所做的所有工作最终都与业务相关。这就引出了我工作的第四部分：与产品经理和产品利益相关者紧密合作，展示能够帮助他们做出商业和产品决策的数据。

我们公司拥有基于数据做决策的良好文化。我相信这确实帮助了产品和公司的成长。

行业前景与课程推荐

这是一个发展非常迅速的领域。几乎所有与技术相关的公司都需要数据。他们需要有人来查看数据并讲述数据背后的故事。

因此，我强烈推荐Algus教授的课程，在那里我不仅学会了如何处理数据，还学会了如何使用数据来讲述故事，帮助改进围绕数据的产品，并帮助提升业务。

本节课中，我们一起学习了数据科学家Dai Li的工作日常。我们了解到，数据科学家的工作不仅涉及使用SQL、Python、R等多种工具进行数据查询、分析和建模，还包括通过脚本进行ETL和文本处理，以及利用可视化工具（如R Shiny）向业务方展示数据洞察。最重要的是，所有分析工作最终都服务于商业决策，体现了数据驱动文化的价值。对于初学者而言，掌握从数据处理到商业应用的全链条思维至关重要。

商业分析职业路径：5：高级软件工程师与技术产品经理 👨‍💻

在本节课中，我们将探讨大数据生态中至关重要的两个角色：高级软件工程师和技术产品经理。他们的职责与之前讨论的商业数据分析师和数据科学家有显著不同。

随着企业拥抱大数据文化，除了商业数据分析师和数据科学家，公司还需要熟练的软件工程师和经验丰富的技术产品经理。他们的核心任务是设计和构建、优化用户体验以及构成公司实时与即时系统的所有底层架构。

核心技能差异

上一节我们介绍了商业数据分析师的通用技能，本节中我们来看看软件工程师的技能构成。之前讨论的九项商业数据分析师必备技能，通常不属于软件工程师的常规技能集。同样，数据科学家所掌握的建模工具、统计方法和机器学习知识，对软件工程师而言也并非必需。

共享的技能领域

然而，软件工程师与数据科学家在部分技术领域存在交集。以下是他们共同掌握的知识：

脚本语言：例如 Python、Java 和 JavaScript。
大数据处理工具：用于处理和检索非结构化数据的工具，如 Hadoop、MapReduce、Hive、Pig 和 Spark。
其他技术：自然语言处理工具的经验，以及基于云的服务（如 AWS）的使用经验。

软件工程师的专属技能

主导大数据项目系统工程和产品管理的软件工程师，通常还具备以下五项额外的专业技能：

底层语言经验：例如 C++ 的使用经验。
高性能数据库知识：对高可扩展、低延迟的商业关系型数据库（如 Oracle 和 Teradata）的了解。
团队领导经验：领导软件开发团队的经验。
项目管理经验：包括软件开发的进度安排和预算制定。
实时数据处理经验：与实时及第三方数据源协作的经验。

职业路径的区分

我们认为有必要明确指出：虽然商业分析师、商业数据分析师和数据科学家的职业路径始于相同的基本技能，并且随着在组织内晋升，其技能重叠度很高，但软件工程师和技术产品经理在技能和经验要求上则非常不同，并且在很大程度上没有重叠。

我们希望你确保自己选择了正确的职业发展路径。

总结

本节课中，我们一起学习了大数据领域高级软件工程师与技术产品经理的角色定位。我们明确了他们与数据分析师的核心技能差异，介绍了他们与数据科学家共享的技术栈，并详细列出了软件工程师独有的五项关键技能。最后，我们强调了这些技术类职业路径与数据分析类路径的本质不同，帮助你更清晰地规划职业方向。

免责声明：本站内容来源于互联网公开信息，仅供学习和参考使用。如涉及版权问题，请联系我们，我们将在核实后第一时间删除相关内容。

标签： 服装生产流程6个步骤