import requests
from bs4 import BeautifulSoup

# Base URL for the database of MIT CS professors
base_url = "https://www.eecs.mit.edu/"

# Make a request to the database of MIT CS professors
response = requests.get(base_url, verify=True)

# Check if the request was successful
if response.status_code == 200:
    # Parse the HTML content of the page
    soup = BeautifulSoup(response.text, "html.parser")

    # Find the elements containing the professor information
    professor_elements = soup.find_all("div", class_="views-row")

    # Loop through the professor elements and extract their information
    for i, professor in enumerate(professor_elements):
        if i == 30:
            break

        name = professor.find("h2").text
        email = professor.find("a", class_="email").text
        area_of_interest = professor.find("div", class_="field-name-field-research-areas").text

        # Store the information for each professor in a dictionary
        professor_dict = {
            "name": name,
            "email": email,
            "area_of_interest": area_of_interest
        }

        # Append the dictionary to a list
        professor_info.append(professor_dict)

# If the request was not successful, print an error message
else:
    print("Failed to retrieve data from the website.")

# Print the list of dictionaries
print(professor_info)

为什么代码无法从网站检索数据?这是一个剪贴器,它可以访问麻省理工学院的教授数据库,收集他们的电子邮件、姓名和电子邮件机器人感兴趣的区域,但剪贴器无法在atm机上工作。

Professor Information Scraper机器人的更多相关文章

  1. 我如何在数千种变体中为我的ML模型选择最佳设置?

    我使用MLRandomForest模型,我希望尽可能地设置它的所有重要参数。因此,为此,我在多个循环中尝试所有可能的变量并保存它们的结果。当我完成时,我只是查看结果,哪种设置是最好的。因此,我向您提出了两个问题:做我正在做的事情是好的吗?我的意思是通过所有变体来找到最佳设置由于我的内存限制,可以在某个网站上完成吗?在线免费编译器,我可以在其上加载数据文件,并要求他们为我计算变量。

  2. Professor Information Scraper机器人

    为什么代码无法从网站检索数据?这是一个剪贴器,它可以访问麻省理工学院的教授数据库,收集他们的电子邮件、姓名和电子邮件机器人感兴趣的区域,但剪贴器无法在atm机上工作。

  3. 为什么ML模型应该对一个输出特性进行很好的预测?

    完成训练后,我将两个输出特征的真实值与预测值进行了比较,结果如下图所示我的问题是,为什么这个模型只能预测一个输出特性?

  4. C编程语言中最好的机器学习库/框架

    用C语言实现的最佳机器学习代码是什么?我做了一些搜索,找到了一些多特蒙德大学的代码,比如“mysvm”,但我想要一个包含不同类型算法的库。

  5. 当一个变量与另一个变量之间似乎没有相关性时,如何找到它们的影响?

    我们可以预测一个项目的销售额增长百分比吗?将上一年的折扣变化作为预测变量。这些之间似乎没有关联。如何使用机器学习解决这个问题?

  6. 用sklearn拟合多维数据的线性回归

    我正在尝试使用时间序列数据上的sklearn拟合线性回归。唯一的问题是,据我所知,数据不符合通常的时间序列格式。下面是一个示例:我很抱歉,如果这有点难读,但我的想法是,每个列表都代表了当时的一些上下文,其中的每个列表。这是可以的,除非我有多个上下文,但我希望它们都在同一个模型上训练。顺便说一句,当运行上面的代码时,我会得到逻辑上的错误:因为,sklearn需要以下格式的数据:

  7. 我们如何使用功能重要性来查找'最差'特征?

    基本上,我想运行一个功能重要性练习,以找到对从属功能影响最大的顶级独立功能。我如何使用此模型来查找与顶级独立功能相关联的ID?查看图后,是否只是按RM、LSTAT和DIS的降序对数据帧进行排序,因为这些是影响从属特性的最具影响力的特性?我不认为它是这样工作的,但也许就是这样。在这种情况下,考虑到我的业务需求,我假设RM、LSTAT和DIS是“最差”的功能。

随机推荐

  1. 如何扩展ATmega324PB微控制器的以下宏寄存器?

    我目前正在学习嵌入式,我有以下练习:展开以下宏寄存器:如果有人解决了这个问题,我将不胜感激,以便将来参考

  2. Python将ONNX运行时设置为返回张量而不是numpy数组

    在python中,我正在加载预定义的模型:然后我加载一些数据并运行它:到目前为止,它仍在正常工作,但我希望它默认返回Tensor列表,而不是numpy数组。我对ONNX和PyTorch都是新手,我觉得这是我在这里缺少的基本内容。这将使转换中的一些开销相同。

  3. 在macOS上的终端中使用Shell查找文件中的单词

    我有一个文本文件,其中有一行:我需要找到ID并将其提取到变量中。我想出了一个RexEx模式:但它似乎对我尝试过的任何东西都不起作用:grep、sed——不管怎样。我的一个尝试是:我为这样一个看似愚蠢的问题感到抱歉,但我在互联网上找不到任何东西:我在SO和SE上读了几十个类似的问题,并在谷歌上搜索了几个教程,但仍然无法找到答案。欢迎提供任何指导!

  4. react-chartjs-2甜甜圈图中只有标题未更新

    我正在使用react-chartjs-2在我的网站中实现甜甜圈图。下面是我用来呈现图表的代码。我将甜甜圈图的详细信息从父组件传递到子组件,所有道具都正确传递。当我在beforeDraw函数外部记录props.title时,它会记录正确的值,但当我在beforeDraw函数内部记录props.title时,它将记录标题的前一个值,从而呈现标题的前值。我在这里做错了什么?

  5. 如何在tkinter中使用Python生成器函数?

    生成器函数承诺使某些代码更易于编写。但我并不总是知道如何使用它们。假设我有一个斐波那契生成器函数fib(),我想要一个显示第一个结果的tkinter应用程序。当我点击“下一步”按钮时,它会显示第二个数字,依此类推。我如何构建应用程序来实现这一点?我可能需要在线程中运行生成器。但如何将其连接回GUI?

  6. 如何为每次提交将存储库历史记录拆分为一行?

    我正在尝试获取存储库的历史记录,但结果仅以单行文本的形式返回给我。

  7. 尝试在颤振项目上初始化Firebase时出错

    当尝试在我的颤振项目上初始化firebase时,我收到了这个错误有人知道我能做什么吗?应用程序分级Gradle插件Gradle项目颤振相关性我已经将firebase设置为Google文档已经在另一个模拟器上尝试过,已经尝试过创建一个全新的模拟器,已经在不同的设备上尝试过了,已经尝试了特定版本的firebase,已经尝试添加但没有任何效果,已经在youtube上看到了关于它的每一个视频,该应用程序在android和iOS两个平台上都抛出了这个错误

  8. 在unix中基于当前日期添加新列

    我试图在unix中基于时间戳列在最后一个单元格中添加一个状态列。我不确定如何继续。

  9. 麦克斯·蒙特利。我一直得到UncaughtReferenceError:当我在终端中写入node-v时,节点未定义

    如果这是您应该知道的,请确认:我已将所有shell更改为默认为zsh。当我在终端中写入node-v时,我一直收到“UncaughtReferenceError:nodeisnotdefined”。但它显示节点已安装。我是个新手,在这方面经验不足。

  10. 如何在前端单击按钮时调用后端中的函数?

    那么如何在后端添加一个新的端点,点击按钮调用这个函数。

返回
顶部