我有一个只有几列的数据集。我想通过在“运行编号”列中查找字符串“M22”来切片数据帧。我可以这样做。但是,我想计算包含字符串“M22”的唯一行的数量。
以下是我对下表(示例)所做的操作:
RUN_NUMBER DATE_TIME CULTURE_DAY AGE_HRS AGE_days 335991m 2022年6月30日0 0 0M220621 7/1/2022 1 24 1M220678 7/2/2022 2 48 2510091M 7/3/2022 3 72 3M220500 7/4/2022 4 96 4335991M 7/5/2022 5 120 5M220621 7/2022 6 144 6M220678 7/7/2022 7 168 7335991M 7/8/2022 8 192 8M220621 7/9/2022 9 216 9M220678 7/1022 10
df2['RUN_NUMBER'].str.contains(“M22”).groupby(df['RUN-NUMBER']).sum()
这是我得到的结果:RUN_NUMBER335991M 0510091M 0335992M 0M220621 3M220678 3M220500 1
现在我需要计算包含“M22”的字符串/行:所以我需要得到3作为输出。