添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
  • pandas.Series.is_unique
  • pandas.Series.is_monotonic_increasing
  • pandas.Series.is_monotonic_decreasing
  • pandas.Series.value_counts
  • pandas.Series.align
  • pandas.Series.case_when
  • pandas.Series.drop
  • pandas.Series.droplevel
  • pandas.Series.drop_duplicates
  • pandas.Series.duplicated
  • pandas.Series.equals
  • pandas.Series.head
  • pandas.Series.idxmax
  • pandas.Series.idxmin
  • pandas.Series.isin
  • pandas.Series.reindex
  • pandas.Series.reindex_like
  • pandas.Series.rename
  • pandas.Series.rename_axis
  • pandas.Series.reset_index
  • pandas.Series.sample
  • pandas.Series.set_axis
  • pandas.Series.take
  • pandas.Series.tail
  • pandas.Series.truncate
  • pandas.Series.where
  • pandas.Series.mask
  • pandas.Series.add_prefix
  • pandas.Series.add_suffix
  • pandas.Series.filter
  • pandas.Series.bfill
  • pandas.Series.dropna
  • pandas.Series.ffill
  • pandas.Series.fillna
  • pandas.Series.interpolate
  • pandas.Series.isna
  • pandas.Series.isnull
  • pandas.Series.notna
  • pandas.Series.notnull
  • pandas.Series.replace
  • pandas.Series.argsort
  • pandas.Series.argmin
  • pandas.Series.argmax
  • pandas.Series.reorder_levels
  • pandas.Series.sort_values
  • pandas.Series.sort_index
  • pandas.Series.swaplevel
  • pandas.Series.unstack
  • pandas.Series.explode
  • pandas.Series.searchsorted
  • pandas.Series.repeat
  • pandas.Series.squeeze
  • pandas.Series.compare
  • pandas.Series.update
  • pandas.Series.asfreq
  • pandas.Series.asof
  • pandas.Series.shift
  • pandas.Series.first_valid_index
  • pandas.Series.last_valid_index
  • pandas.Series.resample
  • pandas.Series.tz_convert
  • pandas.Series.tz_localize
  • pandas.Series.at_time
  • pandas.Series.between_time
  • pandas.Series.str
  • pandas.Series.cat
  • pandas.Series.dt
  • pandas.Series.sparse
  • pandas.DataFrame.sparse
  • pandas.Index.str
  • pandas.Series.dt.date
  • pandas.Series.dt.time
  • pandas.Series.dt.timetz
  • pandas.Series.dt.year
  • pandas.Series.dt.month
  • pandas.Series.dt.day
  • pandas.Series.dt.hour
  • pandas.Series.dt.minute
  • pandas.Series.dt.second
  • pandas.Series.dt.microsecond
  • pandas.Series.dt.nanosecond
  • pandas.Series.dt.dayofweek
  • pandas.Series.dt.day_of_week
  • pandas.Series.dt.weekday
  • pandas.Series.dt.dayofyear
  • pandas.Series.dt.day_of_year
  • pandas.Series.dt.days_in_month
  • pandas.Series.dt.quarter
  • pandas.Series.dt.is_month_start
  • pandas.Series.dt.is_month_end
  • pandas.Series.dt.is_quarter_start
  • pandas.Series.dt.is_quarter_end
  • pandas.Series.dt.is_year_start
  • pandas.Series.dt.is_year_end
  • pandas.Series.dt.is_leap_year
  • pandas.Series.dt.daysinmonth
  • pandas.Series.dt.days_in_month
  • pandas.Series.dt.tz
  • pandas.Series.dt.freq
  • pandas.Series.dt.unit
  • pandas.Series.dt.isocalendar
  • pandas.Series.dt.to_period
  • pandas.Series.dt.to_pydatetime
  • pandas.Series.dt.tz_localize
  • pandas.Series.dt.tz_convert
  • pandas.Series.dt.normalize
  • pandas.Series.dt.strftime
  • pandas.Series.dt.round
  • pandas.Series.dt.floor
  • pandas.Series.dt.ceil
  • pandas.Series.dt.month_name
  • pandas.Series.dt.day_name
  • pandas.Series.dt.as_unit
  • pandas.Series.dt.qyear
  • pandas.Series.dt.start_time
  • pandas.Series.dt.end_time
  • pandas.Series.dt.days
  • pandas.Series.dt.seconds
  • pandas.Series.dt.微秒
  • pandas.Series.dt.纳秒
  • pandas.Series.dt.components
  • pandas.Series.dt.unit
  • pandas.Series.dt.to_pytimedelta
  • pandas.Series.dt.total_seconds
  • pandas.Series.dt.as_unit
  • pandas.Series.str.capitalize
  • pandas.Series.str.casefold
  • pandas.Series.str.cat
  • pandas.Series.str.center
  • pandas.Series.str.contains
  • pandas.Series.str.count
  • pandas.Series.str.decode
  • pandas.Series.str.encode
  • pandas.Series.str.endswith
  • pandas.Series.str.extract
  • pandas.Series.str.extractall
  • pandas.Series.str.find
  • pandas.Series.str.findall
  • pandas.Series.str.fullmatch
  • pandas.Series.str.get
  • pandas.Series.str.index
  • pandas.Series.str.join
  • pandas.Series.str.len
  • pandas.Series.str.ljust
  • pandas.Series.str.lower
  • pandas.Series.str.lstrip
  • pandas.Series.str.match
  • pandas.Series.str.normalize
  • pandas.Series.str.pad
  • pandas.Series.str.partition
  • pandas.Series.str.removeprefix
  • pandas.Series.str.removesuffix
  • pandas.Series.str.repeat
  • pandas.Series.str.replace
  • pandas.Series.str.rfind
  • pandas.Series.str.rindex
  • pandas.Series.str.rjust
  • pandas.Series.str.rpartition
  • pandas.Series.str.rstrip
  • pandas.Series.str.slice
  • pandas.Series.str.slice_replace
  • pandas.Series.str.split
  • pandas.Series.str.rsplit
  • pandas.Series.str.startswith
  • pandas.Series.str.strip
  • pandas.Series.str.swapcase
  • pandas.Series.str.title
  • pandas.Series.str.translate
  • pandas.Series.str.upper
  • pandas.Series.str.wrap
  • pandas.Series.str.zfill
  • pandas.Series.str.isalnum
  • pandas.Series.str.isalpha
  • pandas.Series.str.isdigit
  • pandas.Series.str.isspace
  • pandas.Series.str.islower
  • pandas.Series.str.isupper
  • pandas.Series.str.istitle
  • pandas.Series.str.isnumeric
  • pandas.Series.str.isdecimal
  • pandas.Series.str.get_dummies
  • pandas.Series.cat.categories
  • pandas.Series.cat.ordered
  • pandas.Series.cat.codes
  • pandas.Series.cat.rename_categories
  • pandas.Series.cat.reorder_categories
  • pandas.Series.cat.add_categories
  • pandas.Series.cat.remove_categories
  • pandas.Series.cat.remove_unused_categories
  • pandas.Series.cat.set_categories
  • pandas.Series.cat.as_ordered
  • pandas.Series.cat.as_unordered
  • pandas.Series.sparse.npoints
  • pandas.Series.sparse.density
  • pandas.Series.sparse.fill_value
  • pandas.Series.sparse.sp_values
  • pandas.Series.sparse.from_coo
  • pandas.Series.sparse.to_coo
  • pandas.Series.list.flatten
  • pandas.Series.list.len
  • pandas.Series.list.__getitem__
  • pandas.Series.struct.dtypes
  • pandas.Series.struct.field
  • pandas.Series.struct.explode
  • pandas.Flags
  • pandas.Series.attrs
  • pandas.Series.plot
  • pandas.Series.plot.area
  • pandas.Series.plot.bar
  • pandas.Series.plot.barh
  • pandas.Series.plot.box
  • pandas.Series.plot.density
  • pandas.Series.plot.hist
  • pandas.Series.plot.kde
  • pandas.Series.plot.line
  • pandas.Series.plot.pie
  • pandas.Series.hist
  • pandas.Series.to_pickle
  • pandas.Series.to_csv
  • pandas.Series.to_dict
  • pandas.Series.to_excel
  • pandas.Series.to_frame
  • pandas.Series.to_xarray
  • pandas.Series.to_hdf
  • pandas.Series.to_sql
  • pandas.Series.to_json
  • pandas.Series.to_string
  • pandas.Series.to_clipboard
  • pandas.Series.to_latex
  • pandas.Series.to_markdown
  • DataFrame
  • pandas 数组、标量和数据类型
  • 日期偏移量
  • GroupBy
  • 选项和设置
  • Series. replace ( to_replace=None , value=<no_default> , * , inplace=False , regex=False ) [源代码] #

    to_replace 中的值替换为 value

    Series/DataFrame 的值被动态替换为其他值。这与使用 .loc .iloc 进行更新不同,后者需要你指定一个位置来用某个值进行更新。

    替换为 str, regex, list, dict, Series, int, float, 或 None

    如何找到将被替换的值。

  • 数字, 字符串或正则表达式:

  • numeric: 数值等于 to_replace 的将被替换为 value

  • str: 完全匹配 to_replace 的字符串将被替换为 value

  • regex: 匹配 to_replace 的正则表达式将被替换为 value

  • 字符串列表、正则表达式或数字:

  • 首先,如果 to_replace value 都是列表,它们**必须**具有相同的长度。

  • 其次,如果 regex=True ,那么 两个 列表中的所有字符串都将被解释为正则表达式,否则它们将直接匹配。这对于 value 来说并不重要,因为只有少数几个可能的替换正则表达式可以使用。

  • str、regex 和 numeric 规则如上所述适用。

  • dict:

  • 字典可以用来为不同的现有值指定不同的替换值。例如, {'a': 'b', 'y': 'z'} 将值 ‘a’ 替换为 ‘b’ 并将 ‘y’ 替换为 ‘z’。要以这种方式使用字典,不应给出可选的 value 参数。

  • 对于一个 DataFrame,字典可以指定在不同的列中应该替换不同的值。例如, {'a': 1, 'b': 'z'} 在列 ‘a’ 中查找值 1,在列 ‘b’ 中查找值 ‘z’,并将这些值替换为 value 中指定的任何内容。在这种情况下, value 参数不应为 None 。你可以将这视为传递两个列表的特殊情况,只不过你指定了要搜索的列。

  • 对于一个嵌套字典的 DataFrame,例如 {'a': {'b': np.nan}} ,读取方式如下:在列 ‘a’ 中查找值 ‘b’ 并用 NaN 替换它。在这种方式下,不应指定可选的 value 参数。你也可以嵌套正则表达式。请注意,列名(嵌套字典中的顶级字典键)**不能**是正则表达式。

  • None:

  • 这意味着 regex 参数必须是一个字符串、编译的正则表达式,或者是列表、字典、ndarray 或 Series 的此类元素。如果 value 也是 None ,那么这 必须 是一个嵌套的字典或 Series。

  • 请参阅示例部分,了解每个示例的示例。

    scalar, dict, list, str, regex, 默认 None

    用于替换任何匹配 to_replace 的值。对于 DataFrame,可以使用值的字典来指定每列要使用的值(不在字典中的列将不会被填充)。正则表达式、字符串以及这些对象的列表或字典也是允许的。

    inplace bool, 默认 False

    如果为真,则就地执行操作并返回 None。

    regex : bool 或与 to_replace 相同类型的值,默认为 False 布尔值或与相同类型

    是否将 to_replace 和/或 value 解释为正则表达式。或者,这可以是一个正则表达式或列表、字典或正则表达式数组,在这种情况下 to_replace 必须为 None

    系列/数据帧

    替换后的对象。

    AssertionError
    • 如果 regex 不是一个 bool 并且 to_replace 不是 None

    • TypeError
      • 如果 to_replace 不是一个标量、类数组、 dict None

      • 如果 to_replace 是一个 dict value 不是一个 list dict ndarray Series

      • 如果 to_replace None 并且 regex 不能编译成正则表达式或是一个列表、字典、ndarray 或 Series。

      • 当替换多个 bool datetime64 对象且 to_replace 的参数与被替换的值的类型不匹配时

      • ValueError
        • 如果将 list ndarray 传递给 to_replace value 但它们的长度不同。

        • 正则表达式替换在后台通过 re.sub 执行。 re.sub 的替换规则是相同的。

        • 正则表达式只会替换字符串,这意味着你不能提供例如匹配浮点数的正则表达式,并期望数据框中具有数值类型的列会被匹配。然而,如果那些浮点数*是*字符串,那么你可以这样做。

        • 这种方法有 很多 选项。鼓励你进行实验并使用这种方法来获得对其工作原理的直观理解。

        • 当 dict 用作 to_replace 值时,dict 中的键是 to_replace 部分,dict 中的值是 value 参数。

        • 标量 `to_replace` 和 `value`

          >>> s = pd.Series([1, 2, 3, 4, 5])
          >>> s.replace(1, 5)
          0    5
          1    2
          2    3
          3    4
          4    5
          dtype: int64
          
          >>> df = pd.DataFrame({'A': [0, 1, 2, 3, 4],
          ...                    'B': [5, 6, 7, 8, 9],
          ...                    'C': ['a', 'b', 'c', 'd', 'e']})
          >>> df.replace(0, 5)
              A  B  C
          0  5  5  a
          1  1  6  b
          2  2  7  c
          3  3  8  d
          4  4  9  e
          

          类似列表的 `to_replace`

          >>> df.replace([0, 1, 2, 3], 4)
              A  B  C
          0  4  5  a
          1  4  6  b
          2  4  7  c
          3  4  8  d
          4  4  9  e
          
          >>> df.replace([0, 1, 2, 3], [4, 3, 2, 1])
              A  B  C
          0  4  5  a
          1  3  6  b
          2  2  7  c
          3  1  8  d
          4  4  9  e
          

          类似字典的 `to_replace`

          >>> df.replace({0: 10, 1: 100})
                  A  B  C
          0   10  5  a
          1  100  6  b
          2    2  7  c
          3    3  8  d
          4    4  9  e
          
          >>> df.replace({'A': 0, 'B': 5}, 100)
                  A    B  C
          0  100  100  a
          1    1    6  b
          2    2    7  c
          3    3    8  d
          4    4    9  e
          
          >>> df.replace({'A': {0: 100, 4: 400}})
                  A  B  C
          0  100  5  a
          1    1  6  b
          2    2  7  c
          3    3  8  d
          4  400  9  e
          

          正则表达式 `to_replace`

          >>> df = pd.DataFrame({'A': ['bat', 'foo', 'bait'],
          ...                    'B': ['abc', 'bar', 'xyz']})
          >>> df.replace(to_replace=r'^ba.$', value='new', regex=True)
                  A    B
          0   new  abc
          1   foo  new
          2  bait  xyz
          
          >>> df.replace({'A': r'^ba.$'}, {'A': 'new'}, regex=True)
                  A    B
          0   new  abc
          1   foo  bar
          2  bait  xyz
          
          >>> df.replace(regex=r'^ba.$', value='new')
                  A    B
          0   new  abc
          1   foo  new
          2  bait  xyz
          
          >>> df.replace(regex={r'^ba.$': 'new', 'foo': 'xyz'})
                  A    B
          0   new  abc
          1   xyz  new
          2  bait  xyz
          
          >>> df.replace(regex=[r'^ba.$', 'foo'], value='new')
                  A    B
          0   new  abc
          1   new  new
          2  bait  xyz
          

          比较 s.replace({'a': None})s.replace('a', None) 的行为以理解 to_replace 参数的特殊之处:

          >>> s = pd.Series([10, 'a', 'a', 'b', 'a'])
          

          当使用一个字典作为 to_replace 值时,字典中的值等于 value 参数。s.replace({'a': None}) 等同于 s.replace(to_replace={'a': None}, value=None):

          >>> s.replace({'a': None})
          0      10
          1    None
          2    None
          3       b
          4    None
          dtype: object
          

          如果 None 被显式地传递给 value ,它将被尊重:

          >>> s.replace('a', None)
          0      10
          1    None
          2    None
          3       b
          4    None
          dtype: object
          

          regex=True 时,value 不是 None 并且 to_replace 是一个字符串,替换将在 DataFrame 的所有列中应用。

          >>> df = pd.DataFrame({'A': [0, 1, 2, 3, 4],
          ...                    'B': ['a', 'b', 'c', 'd', 'e'],
          ...                    'C': ['f', 'g', 'h', 'i', 'j']})
          
          >>> df.replace(to_replace='^[a-g]', value='e', regex=True)
              A  B  C
          0  0  e  e
          1  1  e  e
          2  2  e  h
          3  3  e  i
          4  4  e  j
          

          如果 value 不是 None 并且 to_replace 是一个字典,字典的键将是替换将应用的 DataFrame 列。

          >>> df.replace(to_replace={'B': '^[a-c]', 'C': '^[h-j]'}, value='e', regex=True)
              A  B  C
          0  0  e  f
          1  1  e  g
          2  2  e  e
          3  3  d  e
          4  4  e  e