254 字 1 分钟阅读

实现 int sqrt(int x) 函数。

计算并返回 x 的平方根,其中 x 是非负整数。

由于返回类型是整数,结果只保留整数的部分,小数部分将被舍去。

示例 1:

输入: 4
输出: 2

示例 2:

输入: 8
输出: 2
说明: 8 的平方根是 2.82842..., 
     由于返回类型是整数,小数部分将被舍去。

思路

牛顿迭代算法 \(a_{i}=(x \div a_{i-1} + a_{i-1}) \div 2\)

解法

牛顿迭代法是一种可以用来快速求解函数零点的方法。

为了叙述方便,我们用 $C$ 表示待求出平方根的那个整数。显然,$C$ 的平方根就是函数 \(y=f(x)=x^2−C\) 的零点。

牛顿迭代法的本质是借助泰勒级数,从初始值开始快速向零点逼近。我们任取一个 $x_{i}$​​​ 作为初始值,在每一步的迭代中,我们找到函数图像上的点 $(x_{i}, f(x_{i}))$​​​,过该点作一条斜率为该点导数 $f’(x_{i})$​​​ 的直线,与横轴的交点记为 $x_{i+1}$​​​。 $x_{i+1}$​​​相较于而言距离零 $x_{i}$​​​ 点更近。在经过多次迭代后,我们就可以得到一个距离零点非常接近的交点。下图给出了从 $x_{0}$​​​ 开始迭代两次,得到 $x_{1}$​​​ 和 $x_{2}$​​ ​的过程。

fig1

算法

我们选择 $x_{0} = C$ 作为初始值。

在每一步迭代中,我们通过当前的交点 $x_{i}$​​​​​,找到函数图像上的点 $(x_{i}, x_{i}^2 - C)$​​​​​,作一条斜率为 $f’(x_{i})=2x_{i}$​​​​​ 的直线,直线的方程为(一元多项式 $x^n$​ 的一阶导数为 $nx^{n-1}$​): \(\begin{gather} yl = 2x_{i}(x−x_{i}) + x_{i}^2 − C \\ = 2x_{i}x − (x_{i}^2 + C) \end{gather}\) 与横轴的交点为方程 $ 2x_{i}x − (x_{i}^2 + C) = 0 $​​ 的解,即为新的迭代结果 $ x_{i}+1$​​​ : \(x_{i+1} = \frac{1}{2}(x_{i} + x_{i}C)\) 在进行 $ k $ 次迭代后,$ x_{k} $ 的值与真实的零点 $ \sqrt{C}$ 足够接近,即可作为答案。

细节

  • 为什么选择 $x_{0} = C$ 作为初始值?

    因为$ y = x^2 - C$ 有两个零点 $-\sqrt{C} 和 \sqrt{C}$。如果我们取的初始值较小,可能会迭代到 $-\sqrt{C}$ 这个零点,而我们希望找到的是 $\sqrt{C}$ 这个零点。因此选择 $x_0 = C$ 作为初始值,每次迭代均有 $x_{i+1} < x_i$,零点 $\sqrt{C}$ 在其左侧,所以我们一定会迭代到这个零点。

  • 迭代到何时才算结束?

    每一次迭代后,我们都会距离零点更进一步,所以当相邻两次迭代得到的交点非常接近时,我们就可以断定,此时的结果已经足够我们得到答案了。一般来说,可以判断相邻两次迭代的结果的差值是否小于一个极小的非负数 $\epsilon$​​,其中 $\epsilon$​​ 一般可以取 $10^{-6}$​​ 或 $10^{-7}$​​ 。

  • 如何通过迭代得到的近似零点得出最终的答案?

    由于 $y = f(x)$ 在 $ [\sqrt{C}, +\infty]$ 上是凸函数(convex function)且恒大于等于零,那么只要我们选取的初始值 $x_0$ 大于等于 $\sqrt{C}$,每次迭代得到的结果 $x_i$ 都会恒大于等于 $\sqrt{C}$。因此只要 $\epsilon$ 选择地足够小,最终的结果 $x_k$ 只会稍稍大于真正的零点 $\sqrt{C}$。在题目给出的 32 位整数范围内,不会出现下面的情况:

    真正的零点为 $n - 1/2\epsilon$,其中 $n$ 是一个正整数,而我们迭代得到的结果为 $n + 1/2\epsilon$。在对结果保留整数部分后得到 $n$,但正确的结果为 $n - 1$。

class Solution {
    public int mySqrt(int x) {
        if (x == 0) {
            return 0;
        }

        double C = x, x0 = x;
        while (true) {
            double xi = 0.5 * (x0 + C / x0);
            if (Math.abs(x0 - xi) < 1e-7) {
                break;
            }
            x0 = xi;
        }
        return (int) x0;
    }
}