Невозможно воспроизвести мини-пакетный градиентный спуск Tensorflow [закрыто]

Невозможно воспроизвести мини-пакетный градиентный спуск Tensorflow [закрыто] ⇐ C++

1 сообщение • Страница 1 из 1

Anonymous

Невозможно воспроизвести мини-пакетный градиентный спуск Tensorflow [закрыто]

Цитата

Сообщение Anonymous » 01 май 2024, 20:26

В чем разница между реализацией градиентного спуска из учебника и реализацией тензорных потоков?
Либо я делаю ошибку при градиентном спуске, либо тензорный поток что-то делает кроме реализации учебника. Я не могу понять, какой именно.
Я написал код на C++, реализующий простейший пример ИНС. Линейная активация, 1 скрытый слой, 10 узлов. Вот мой код на C++:
class Layer
{

public:
double threshold = 0.5;
VectorXd zl;
MatrixXd Weights;

void create_layer(int n_nodes, const Layer &ConnectedLayer)
{

Weights = normrnd(0, sqrt(1.0 / (ConnectedLayer.zl.size() + n_nodes)), n_nodes,
ConnectedLayer.zl.size());
zl.resize(n_nodes);
}

void create_input_layer(int n_nodes)
{
zl.resize(n_nodes);
}

template
void compute_self(Layer &ConnectedLayer, const T &ActivationClass)
{
zl = ActivationClass.activation(Weights, ConnectedLayer.zl);
}

void compute_self(VectorXd &x)
{
zl = x;
}
};

class Network
{
public:
vector layers;
double learning_rate;
double Fx_diff_tol;
double abs_err_tol;
int sims;
int batch_size;
map X_batches;
map y_batches;
bool permute;

Network(int _sims, int _batch_size, double _learning_rate, double _Fx_diff_tol, double _abs_err_tol,
bool _permute = true)
{
sims = _sims;
batch_size = _batch_size;
learning_rate = _learning_rate;
Fx_diff_tol = _Fx_diff_tol;
abs_err_tol = _abs_err_tol;
permute = _permute;
}

void add_layer(Layer L)
{
layers.push_back(L);
}

template
VectorXd compute_net(const MatrixXd &X, const T &ActivationClass)
{
VectorXd z_output(X.rows());
for (int i = 0; i < X.rows(); ++i)
{
for (int k = 0; k < layers.size(); ++k)
{
if (k == 0)
{
VectorXd z0 = X.row(i);
layers[0].compute_self(z0);
}
else
{
layers[k].compute_self(layers[k - 1], ActivationClass);
}
}
z_output(i) = layers[layers.size() - 1].zl.value();
}
return z_output;
}

void check_gradient(MatrixXd &grad)
{
double clip = 100;
for (int i = 0; i < grad.rows(); i++)
{
for (int j = 0; j < grad.rows(); j++)
{
if (abs(grad(i, j)) < 1e-6)
{
grad(i, j) = 0;
}
}
}
if (grad.squaredNorm() > clip)
{
grad = clip * grad / grad.squaredNorm();
}
}

void check_gradient(VectorXd &grad)
{
double clip = 100;
for (int i = 0; i < grad.rows(); i++)
{
if (abs(grad(i)) < 1e-6)
{
grad(i) = 0;
}
}
if (grad.squaredNorm() > clip)
{
grad = clip * grad / grad.squaredNorm();
}
}

void batch_data(const MatrixXd &X, const VectorXd &y, bool permute = true)
{
time_t now = time(0);
boost::random::mt19937 GLOBAL_SEED(now);
std::mt19937 eng(GLOBAL_SEED);
if (permute)
{
PermutationMatrix perm(X.rows());
perm.setIdentity();
shuffle(perm.indices().data(), perm.indices().data() + perm.indices().size(), eng);
MatrixXd Xcopy = perm * X;
VectorXd ycopy = perm * y;
int rows = Xcopy.rows();
int batches = rows / batch_size;
int rem = rows % batch_size;
if (rem)
{
batches++;
}
int c = 0;
for (int b = 0; b < batches; ++b)
{

if (c + batch_size - 1 < rows)
{
X_batches = Xcopy.block(c, 0, batch_size, Xcopy.cols());
y_batches = ycopy.segment(c, batch_size);
c += batch_size;
}
else
{
X_batches = Xcopy.block(c, 0, rem, Xcopy.cols());
y_batches = ycopy.segment(c, rem);
c += batch_size;
}
}
}
else
{
int rows = X.rows();
int batches = rows / batch_size;
int rem = rows % batch_size;
if (rem)
{
batches++;
}
int c = 0;
for (int b = 0; b < batches; ++b)
{

if (c + batch_size - 1 < rows)
{
X_batches = X.block(c, 0, batch_size, X.cols());
y_batches = y.segment(c, batch_size);
c += batch_size;
}
else
{
X_batches = X.block(c, 0, rem, X.cols());
y_batches = y.segment(c, rem);
c += batch_size;
}
}
}
}

template
VectorXd run_model(const MatrixXd &X, const VectorXd &targets, const T1 &ActivationObj, const T2 &Loss)
{
double delta = learning_rate;
VectorXd grad_z_E;
MatrixXd grad_w_E;
double avg_error = 0;
double error;
batch_data(X, targets, permute);
int Batches = y_batches.size();
map deltas;
for (int i = 1; i

Подробнее здесь: https://stackoverflow.com/questions/784 ... nt-descent

1714584404

Anonymous

[b]В чем разница между реализацией градиентного спуска из учебника и реализацией тензорных потоков?[/b]
Либо я делаю ошибку при градиентном спуске, либо тензорный поток что-то делает кроме реализации учебника. Я не могу понять, какой именно.
Я написал код на C++, реализующий простейший пример ИНС. Линейная активация, 1 скрытый слой, 10 узлов.  Вот мой код на C++:
class Layer
{

public:
double threshold = 0.5;
VectorXd zl;
MatrixXd Weights;

void create_layer(int n_nodes, const Layer &ConnectedLayer)
{

Weights = normrnd(0, sqrt(1.0 / (ConnectedLayer.zl.size() + n_nodes)), n_nodes,
ConnectedLayer.zl.size());
zl.resize(n_nodes);
}

void create_input_layer(int n_nodes)
{
zl.resize(n_nodes);
}

template 
void compute_self(Layer &ConnectedLayer, const T &ActivationClass)
{
zl = ActivationClass.activation(Weights, ConnectedLayer.zl);
}

void compute_self(VectorXd &x)
{
zl = x;
}
};

class Network
{
public:
vector layers;
double learning_rate;
double Fx_diff_tol;
double abs_err_tol;
int sims;
int batch_size;
map X_batches;
map y_batches;
bool permute;

Network(int _sims, int _batch_size, double _learning_rate, double _Fx_diff_tol, double _abs_err_tol,
bool _permute = true)
{
sims = _sims;
batch_size = _batch_size;
learning_rate = _learning_rate;
Fx_diff_tol = _Fx_diff_tol;
abs_err_tol = _abs_err_tol;
permute = _permute;
}

void add_layer(Layer L)
{
layers.push_back(L);
}

template 
VectorXd compute_net(const MatrixXd &X, const T &ActivationClass)
{
VectorXd z_output(X.rows());
for (int i = 0; i < X.rows(); ++i)
{
for (int k = 0; k < layers.size(); ++k)
{
if (k == 0)
{
VectorXd z0 = X.row(i);
layers[0].compute_self(z0);
}
else
{
layers[k].compute_self(layers[k - 1], ActivationClass);
}
}
z_output(i) = layers[layers.size() - 1].zl.value();
}
return z_output;
}

void check_gradient(MatrixXd &grad)
{
double clip = 100;
for (int i = 0; i < grad.rows(); i++)
{
for (int j = 0; j < grad.rows(); j++)
{
if (abs(grad(i, j)) < 1e-6)
{
grad(i, j) = 0;
}
}
}
if (grad.squaredNorm() > clip)
{
grad = clip * grad / grad.squaredNorm();
}
}

void check_gradient(VectorXd &grad)
{
double clip = 100;
for (int i = 0; i < grad.rows(); i++)
{
if (abs(grad(i)) < 1e-6)
{
grad(i) = 0;
}
}
if (grad.squaredNorm() > clip)
{
grad = clip * grad / grad.squaredNorm();
}
}

void batch_data(const MatrixXd &X, const VectorXd &y, bool permute = true)
{
time_t now = time(0);
boost::random::mt19937 GLOBAL_SEED(now);
std::mt19937 eng(GLOBAL_SEED);
if (permute)
{
PermutationMatrix perm(X.rows());
perm.setIdentity();
shuffle(perm.indices().data(), perm.indices().data() + perm.indices().size(), eng);
MatrixXd Xcopy = perm * X;
VectorXd ycopy = perm * y;
int rows = Xcopy.rows();
int batches = rows / batch_size;
int rem = rows % batch_size;
if (rem)
{
batches++;
}
int c = 0;
for (int b = 0; b < batches; ++b)
{

if (c + batch_size - 1 <  rows)
{
X_batches[b] = Xcopy.block(c, 0, batch_size, Xcopy.cols());
y_batches[b] = ycopy.segment(c, batch_size);
c += batch_size;
}
else
{
X_batches[b] = Xcopy.block(c, 0, rem, Xcopy.cols());
y_batches[b] = ycopy.segment(c, rem);
c += batch_size;
}
}
}
else
{
int rows = X.rows();
int batches = rows / batch_size;
int rem = rows % batch_size;
if (rem)
{
batches++;
}
int c = 0;
for (int b = 0; b < batches; ++b)
{

if (c + batch_size - 1 < rows)
{
X_batches[b] = X.block(c, 0, batch_size, X.cols());
y_batches[b] = y.segment(c, batch_size);
c += batch_size;
}
else
{
X_batches[b] = X.block(c, 0, rem, X.cols());
y_batches[b] = y.segment(c, rem);
c += batch_size;
}
}
}
}

template 
VectorXd run_model(const MatrixXd &X, const VectorXd &targets, const T1 &ActivationObj, const T2 &Loss)
{
double delta = learning_rate;
VectorXd grad_z_E;
MatrixXd grad_w_E;
double avg_error = 0;
double error;
batch_data(X, targets, permute);
int Batches = y_batches.size();
map deltas;
for (int i = 1; i 

Подробнее здесь: [url]https://stackoverflow.com/questions/78414151/cant-replicate-tensorflows-mini-batch-gradient-descent[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Невозможно воспроизвести мини-пакетный градиентный спуск Tensorflow.

Последнее сообщение Anonymous « 01 май 2024, 17:09
Добавлено в форуме C++

Anonymous » 01 май 2024, 17:09 » в форуме C++

Я написал код на C++, реализующий простейший пример ИНС. Линейная активация, 1 скрытый слой, 10 узлов. Вот мой код на C++:
class Layer
{

public:
double threshold = 0.5;
VectorXd zl;
MatrixXd Weights;

void create_layer(int n_nodes, const Layer...

0 Ответы

53 Просмотры

Последнее сообщение Anonymous
01 май 2024, 17:09
Как мне реализовать градиентный спуск в нейронной сети?

Последнее сообщение Гость « 09 апр 2024, 11:57
Добавлено в форуме Python

Гость » 09 апр 2024, 11:57 » в форуме Python

Я пытаюсь создать простую нейронную сеть на Python. Используя это видео ( hfMk-kjRv4c я пытаюсь добавить порог, при котором, если входной нейрон/узел превысит его, будет возвращено значение, равное единице. Я внедрил пороговое значение вручную, но...

0 Ответы

35 Просмотры

Последнее сообщение Гость
09 апр 2024, 11:57
Многовариантный градиентный спуск

Последнее сообщение Anonymous « 10 май 2024, 09:35
Добавлено в форуме Python

Anonymous » 10 май 2024, 09:35 » в форуме Python

Я изучаю градиентный спуск для расчета коэффициентов. Ниже описано, что я делаю:

#!/usr/bin/Python

import numpy as np

# m denotes the number of examples here, not the number of features
def gradientDescent(x, y, theta, alpha, m, numIterations):...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
10 май 2024, 09:35
Градиентный спуск для СВР?

Последнее сообщение Anonymous « 19 ноя 2024, 06:31
Добавлено в форуме Python

Anonymous » 19 ноя 2024, 06:31 » в форуме Python

Я хочу использовать градиентный спуск в регрессии опорных векторов (SVR). Есть ли какая-нибудь инструкция по этому поводу?
Градиентный спуск Или другие методы для повышения точности аппроксимации
Градиентный спуск для SVR из-за уменьшения...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
19 ноя 2024, 06:31
CMake — невозможно правильно связать спуск на спуске на MacOS

Последнее сообщение Anonymous « 31 май 2024, 23:16
Добавлено в форуме C++

Anonymous » 31 май 2024, 23:16 » в форуме C++

Я собрал и установил abseil из исходного кода следующим образом:
cd ./abseil-cpp
git checkout 5dd240724366295970c613ed23d0092bcf392f18
mkdir build
cd ./build
cmake -DCMAKE_CXX_STANDARD=17 ..
make -j 4
sudo make install

Это мой CMakeLists.txt:...

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
31 май 2024, 23:16

Вернуться в «C++»