PulseAudio Создайте виртуальный микрофон и используйте его в Python

PulseAudio Создайте виртуальный микрофон и используйте его в Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

PulseAudio Создайте виртуальный микрофон и используйте его в Python

Цитата

Сообщение Anonymous » 29 окт 2024, 09:06

Я работаю над созданием виртуального микрофона, который зеркально отображает динамики, в значительной степени петлевого подключения к микрофону.
Мне удалось успешно создать этот микрофон, и когда я смотрю на pavucontrol, он показывает, что микрофон копирует звуковые волны в качестве динамиков. НО когда я подключаю его к скрипту Python, я пробовал все доступные входы, он ничего не читает и не слышит.
Я не уверен на 100%, что правильно настроил этот виртуальный микрофон.
Вот что я сделал.
Я создаю новый виртуальный микрофон:
pactl load-module module-pipe-source source_name=virtual_mic file=/tmp/virtual_mic format=s16le rate=44100 channels=2

Я получаю индекс нового микрофона:
pactl list sources

index: 2
name:
driver:
module: 22
properties:
device.string = "/tmp/virtual_mic"
device.description = "Unix FIFO source /tmp/virtual_mic"
device.icon_name = "audio-input-microphone"

Я получаю индекс моих ораторов
Sink #2
State: IDLE
Name: alsa_output.pci-0000_02_02.0.analog-stereo
Description: ES1371/ES1373 / Creative Labs CT2518 (Audio PCI 64V/128/5200 / Creative CT4810/CT5803/CT5806 [Sound Blaster PCI]) Analog Stereo
Driver: module-alsa-card.c

Я создаю петлю между микрофоном и динамиками
pactl load-module module-loopback source=virtual_mic sink=alsa_output.pci-0000_02_02.0.analog-stereo

Я запускаю этот скрипт Python, чтобы получить все мои исходные коды
import pyaudio
import subprocess

def get_pulseaudio_sources():
result = subprocess.run(['pacmd', 'list-sources'], capture_output=True, text=True)
sources = result.stdout.split('\n')

# Extract source indexes and names
source_info = [line.strip() for line in sources if line.startswith('index') or line.startswith('device.description')]
source_info = [info.split(':')[-1].strip() for info in source_info]
source_indexes = [int(source_info) for i in range(0, len(source_info), 2)]
source_names = [source_info for i in range(1, len(source_info), 2)]

return dict(zip(source_indexes, source_names))

audio = pyaudio.PyAudio()
inputdevice = 0

pulseaudio_sources = get_pulseaudio_sources()

print("\nStarting Audio Devices \n")
# Get all Audio Devices
for i in range(audio.get_device_count()):
device_info = audio.get_device_info_by_index(i)
device_name = device_info['name']
device_index = device_info['index']

print(f"Device {i}: {device_name}" )
print(f" Index: {device_index}")

for pulseaudio_index, pulseaudio_name in pulseaudio_sources.items():
if pulseaudio_name in device_name:
print(f" Matches PulseAudio Source Index: {pulseaudio_index}")
break
print("-----")

Вот что я получаю:
Запуск аудиоустройств
Device 0: Ensoniq AudioPCI: ES1371 DAC1 (hw:0,1)
Index: 0
-----
Device 1: pulse
Index: 1
-----
Device 2: default
Index: 2
-----

Когда я пробую разные индексы в своем коде, он не находит никакого звука (я перепробовал все).
import sounddevice as sd
import numpy as np
from transformers import pipeline

def record_audio_callback(indata, frames, time, status):
if status:
print(status)
# Process the audio data if needed
else:
print("inside record")
try:
# Convert the recorded audio to text
recognizer = pipeline("automatic-speech-recognition", model="openai/whisper-medium")
result = recognizer(np.squeeze(indata))

# Print the entire 'result' for debugging
print("Full result:", result)

# Check if 'transcription' is present in the result
#if 'transcription' in result[0]:
#if result and isinstance(result, list) and result[0].get('transcription'):
if result and isinstance(result, dict) and result.get('text'):
#transcription = result[0]['transcription']
transcription = result['text']
print("Transcription:", transcription)
else:
print ("No valid Transcription found in result")
except Exception as e:
print("Error during transcription: ", e)

# Set the audio parameters
channels = 1 # Mono audio
sample_rate = 44100
input_device = 1

# Start recording
with sd.InputStream(callback=record_audio_callback, channels=channels, samplerate=sample_rate, device=input_device):
print("Inside Live Audio Listen")
try:
sd.sleep(20000) # Record for 10 seconds (adjust as needed)
except KeyboardInterrupt:
print("Keyboard Stopped Recording")

Подробнее здесь: https://stackoverflow.com/questions/779 ... -in-python

1730182008

Anonymous

Я работаю над созданием виртуального микрофона, который зеркально отображает динамики, в значительной степени петлевого подключения к микрофону.
Мне удалось успешно создать этот микрофон, и когда я смотрю на pavucontrol, он показывает, что микрофон копирует звуковые волны в качестве динамиков.  НО когда я подключаю его к скрипту Python, я пробовал все доступные входы, он ничего не читает и не слышит.
Я не уверен на 100%, что правильно настроил этот виртуальный микрофон.
Вот что я сделал.
Я создаю новый виртуальный микрофон:
pactl load-module module-pipe-source source_name=virtual_mic file=/tmp/virtual_mic format=s16le rate=44100 channels=2

Я получаю индекс нового микрофона:
pactl list sources

index: 2
name: 
driver: 
module: 22
properties:
device.string = "/tmp/virtual_mic"
device.description = "Unix FIFO source /tmp/virtual_mic"
device.icon_name = "audio-input-microphone"

Я получаю индекс моих ораторов
Sink #2
State: IDLE
Name: alsa_output.pci-0000_02_02.0.analog-stereo
Description: ES1371/ES1373 / Creative Labs CT2518 (Audio PCI 64V/128/5200 / Creative CT4810/CT5803/CT5806 [Sound Blaster PCI]) Analog Stereo
Driver: module-alsa-card.c

Я создаю петлю между микрофоном и динамиками
pactl load-module module-loopback source=virtual_mic sink=alsa_output.pci-0000_02_02.0.analog-stereo

Я запускаю этот скрипт Python, чтобы получить все мои исходные коды
import pyaudio
import subprocess

def get_pulseaudio_sources():
result = subprocess.run(['pacmd', 'list-sources'], capture_output=True, text=True)
sources = result.stdout.split('\n')

# Extract source indexes and names
source_info = [line.strip() for line in sources if line.startswith('index') or line.startswith('device.description')]
source_info = [info.split(':')[-1].strip() for info in source_info]
source_indexes = [int(source_info[i]) for i in range(0, len(source_info), 2)]
source_names = [source_info[i] for i in range(1, len(source_info), 2)]

return dict(zip(source_indexes, source_names))

audio = pyaudio.PyAudio()
inputdevice = 0

pulseaudio_sources = get_pulseaudio_sources()

print("\nStarting Audio Devices \n")
# Get all Audio Devices
for i in range(audio.get_device_count()):
device_info = audio.get_device_info_by_index(i)
device_name = device_info['name']
device_index = device_info['index']

print(f"Device {i}: {device_name}" )
print(f" Index: {device_index}")

for pulseaudio_index, pulseaudio_name in pulseaudio_sources.items():
if pulseaudio_name in device_name:
print(f"  Matches PulseAudio Source Index: {pulseaudio_index}")
break
print("-----")

Вот что я получаю:
Запуск аудиоустройств
Device 0: Ensoniq AudioPCI: ES1371 DAC1 (hw:0,1)
Index: 0
-----
Device 1: pulse
Index: 1
-----
Device 2: default
Index: 2
-----

Когда я пробую разные индексы в своем коде, он не находит никакого звука (я перепробовал все).
import sounddevice as sd
import numpy as np
from transformers import pipeline

def record_audio_callback(indata, frames, time, status):
if status:
print(status)
# Process the audio data if needed
else:
print("inside record")
try:
# Convert the recorded audio to text
recognizer = pipeline("automatic-speech-recognition", model="openai/whisper-medium")
result = recognizer(np.squeeze(indata))

# Print the entire 'result' for debugging
print("Full result:", result)

# Check if 'transcription' is present in the result
#if 'transcription' in result[0]:
#if result and isinstance(result, list) and result[0].get('transcription'):
if result and isinstance(result, dict) and result.get('text'):
#transcription = result[0]['transcription']
transcription = result['text']
print("Transcription:", transcription)
else:
print ("No valid Transcription found in result")
except Exception as e:
print("Error during transcription: ", e)

# Set the audio parameters
channels = 1  # Mono audio
sample_rate = 44100
input_device = 1

# Start recording
with sd.InputStream(callback=record_audio_callback, channels=channels, samplerate=sample_rate, device=input_device):
print("Inside Live Audio Listen")
try:
sd.sleep(20000)  # Record for 10 seconds (adjust as needed)
except KeyboardInterrupt:
print("Keyboard Stopped Recording")
 

Подробнее здесь: [url]https://stackoverflow.com/questions/77927819/pulseaudio-create-virtual-mic-and-use-it-in-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как запрограммировать PulseAudio для совместного использования устройства вывода с приложением Alsa

Последнее сообщение Anonymous « 08 май 2024, 18:23
Добавлено в форуме Linux

Anonymous » 08 май 2024, 18:23 » в форуме Linux

На Raspberry Pi с DAC/AMP HAT под управлением ОС Moode Audio я установил LedFX для реактивных светодиодов только для использования с aplay, а не с Moode. Однако каждый раз, когда я запускаю LedFX с помощью systemctl startledfx, чтобы я мог...

0 Ответы

61 Просмотры

Последнее сообщение Anonymous
08 май 2024, 18:23
Я не могу заставить PulseAudio работать. Доступна ли в WSL другая аудиосистема? [закрыто]

Последнее сообщение Anonymous « 31 май 2024, 21:16
Добавлено в форуме Linux

Anonymous » 31 май 2024, 21:16 » в форуме Linux

Мне нужен способ получить звук без использования PulseAudio в WSL.
Вот проблема на GitHub:
PulseAudio не работает на моем компьютере, поэтому не просите меня обновить мой компьютер и PulseAudio.

Подробнее здесь:

0 Ответы

64 Просмотры

Последнее сообщение Anonymous
31 май 2024, 21:16
Используйте Bluetooth-микрофон в `.asoundrc`

Последнее сообщение Anonymous « 20 апр 2024, 09:28
Добавлено в форуме Linux

Anonymous » 20 апр 2024, 09:28 » в форуме Linux

Я пытаюсь внедрить Google Assistant на Raspberry Pi 4. Вот руководство >
Проблема заключается в том, что я хочу использовать динамик Bluetooth, в котором также есть встроенный микрофон. Мне удалось использовать динамик в файле .asoundrc, но я не...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
20 апр 2024, 09:28
Используйте микрофон наушников anker R50i для записи созданного видео, совместимого с OPPO Reno 3.

Последнее сообщение Anonymous « 02 ноя 2024, 10:27
Добавлено в форуме Android

Anonymous » 02 ноя 2024, 10:27 » в форуме Android

При записи любого звука с помощью наушников Ankr soundcore R50i NC, ИЗУЧАЙТЕ ЗАПИСЬ ГОЛОСА ЧЕРЕЗ МИКРОФОН МОЕГО ТЕЛЕФОНА, А НЕ ЧЕРЕЗ МИКРОФОН НАУШНИКОВ
Попробуйте найти любые настройки записи звука, связанные с записью мультимедиа и найден только в...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
02 ноя 2024, 10:27
Используйте микрофон наушников anker R50i для записи созданного видео, совместимого с OPPO Reno 3 [закрыто]

Последнее сообщение Anonymous « 02 ноя 2024, 12:09
Добавлено в форуме Android

Anonymous » 02 ноя 2024, 12:09 » в форуме Android

При записи любого звука с помощью наушников Ankr soundcore R50i NC, ИЗУЧАЙТЕ ЗАПИСЬ ГОЛОСА ЧЕРЕЗ МИКРОФОН МОЕГО ТЕЛЕФОНА, А НЕ ЧЕРЕЗ МИКРОФОН НАУШНИКОВ
Попробуйте найти любые настройки записи звука, связанные с записью мультимедиа и найден только в...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
02 ноя 2024, 12:09

Вернуться в «Python»